RT,大概是这个样子的
<a href=aaaa></a>
</td>
<a href=bbbb>l</a>
</td>
<a href=cccc></a>
<img src="XXX.png" alt="" class="XXX">
</td>
<a href=dddd></a>
</td>
<a href=eeee></a>
<img src="XXX.png" alt="" class="XXX">
现在我只想提取cccc与dddd
问各位大牛,该怎么破?
新手小白,还望各位大牛耐心解答
搞错了,是cccc与eeee
另外页面中可能有多个需要提取的字符串
用正则表达式实现(C#):
string strReg =“<a.+?href=(cccc|eeee)”;页面中可能有多个类似于cccc,eeee的字符串。我想批量自动提取。如果我理解对的话,这段代码应该是直接提取cccc和eeee。我是小白,如果说错了,还望见谅。我的想法是利用利用<ahref=和<img src="xxx.png"来截取,但是我不知道该怎么写!
追答你到底想取什么数据?
是取整个超链接还是href等于cccc与dddd的的值?
麻烦描述清楚一些,最终是想截取出什么样的值
就是抓取网页中,带有特定标签的连接!一个网页中有多个连接,但部分连接后面有个图片,我想抓这样的连接。
追答你会用jquery吗?
如果会的话,那就很容易办到,比写正则还省事
C# 提取一段html中特定标签中的内容??
string temp="ggg";int start=temp.IndexOf(">"); \/\/>最先出现的位置 int over=temp.LastIndexOf("<"); \/\/<最后出现的位置 string str=temp.Substring(start+1, over-1); \/\/截取从start+1开始,到 \/\/over-1结束的一段子串 \/\/字串第一个字符位置为0 ...
C#如何获取指定Url下特定标签的内容?
using System;using System.Text.RegularExpressions;namespace WebClientDemo{class Program{static void Main(string[] args){string s = @"123456789";var matches = Regex.Matches(s, "(.+?)");foreach (Match match in matches){Console.WriteLine(match.Groups[1].Value);}Console.Read();}...
C# 怎么截取到多个标签中特定的一个(特定的中包含特定的字符串,通过...
如果觉得正则不好掌握 ,可以先查找 然后把后面的字符串存入另一个变量,在这个变量中查找<\/il> 截取这之前的部分就是特定字符串了
请教,C#怎么才能取到第一对标签里面的内容
string s="...";s.IndexOf分别查找和,假设查找结果分别为i和j,那么s.Substring(i+3,j-i-3);就是你要的内容了
c# 怎样截取HTML标签<BR><BR>中间的文字
\/\/用<BR>分割字符串,得到一个字符串数组,其中每个成员就是一个城市信息,但其中会包含 其它 html标签 string[] resultArray = Htmlstring.Split(new string[] { "<BR>" }, StringSplitOptions.RemoveEmptyEntries);for (int i = 0; i < resultArray.Length;i++ ){ resultArray[i] = regex....
C# 如何获取网页的 title 和 meta内容?
1、 网页的 title Page.Header.Title 2、 meta内容 为标签加id,如 HtmlMeta cm = Page.Header.FindControl("mContent");string metaContent = cm.Content; \/\/这里就取到了meta标签的content属性
c#控制台程序获取网页指定div标签
httprequest来做,不要老想着拿webbrowser,那东西效率很差的。请求回html后再用正则去取就行了
c#怎么除去html标签,和多余的空格!!!
{ string input = Input;\/\/去html标签 input = Regex.Replace(input, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase);input = Regex.Replace(input, @"([\\r\\n])[\\s]+", "", RegexOptions.IgnoreCase);input = Regex.Replace(input, @"-->", "", RegexOptions.IgnoreCase);input = ...
C#提取教务处网站的信息,如何提取两个标签的位置
我的代码:string s=rtxt1.Text; \/\/把你的源代码放到richbox控件的rtxt1中 string str_key="<span style=";string str_key2=@"";int i=s.IndexOf(str_key)+str_key.Length;int j=s.IndexOf(str_key2);string str_value=s.Substring(i,j-i);MessageBox.Show(str_value); ;...
用C#怎么提取a标签的超链接?
string reg = @"]*href=([""'])?(?<href>[^'""]+)\\1[^>]*>";var item = Regex.Match(str, reg, RegexOptions.IgnoreCase);Console.WriteLine(item.Groups["href"].Value);第二种使用htmlagilitypack的xpath进行提取 HtmlNodeCollection atts = _doc.DocumentNode.SelectNodes...