邀请bat高手,vba高手解题: 批量读取网页title

题目:
一个文件夹下1000个网页,要求用bat或vba读取批量网页标题,实现以下结果:
文件名1 title1
文件名2 title2
。。。。。
文件名1000 title1000
结果在一个txt里或excel里都可以
网页文件名,1.htm ,2.htm,...1000.htm
网页1.htm内容:
<html>
<head>
<title>title1</title>
</head>
<body>
内容1
</body>
</html>
其它类推

最好贴部分网页的内容,包含TITLE的就行。 先下载sed:

http://sourceforge.net/projects/gnuwin32/files/sed/4.2-1/sed-4.2-1-bin.zip/download

完成后,放到c:\windows\,批处理代码:

@echo off
cd .>new.x & cd .>new.txt
for /f "delims=" %%i in ('dir /s/b *.htm') do (
echo %%~nxi
sed "/<title>/{N;s/\t*\s*//g}; /<title>/!d; s/<[^>]*>//g" "%%i"
)>>"new.x"
sed "N; s/\n/\t/g" new.x > new.txt & del new.x
exit
温馨提示:内容为网友见解,仅供参考
无其他回答

邀请bat高手,vba高手解题: 批量读取网页title
最好贴部分网页的内容,包含TITLE的就行。 先下载sed:http:\/\/sourceforge.net\/projects\/gnuwin32\/files\/sed\/4.2-1\/sed-4.2-1-bin.zip\/download 完成后,放到c:\\windows\\,批处理代码:echo off cd .>new.x & cd .>new.txt for \/f "delims=" %%i in ('dir \/s\/b *.htm') do (...

相似回答