当前位置:编程学习 > C#/ASP.NET >>

怎么抓取别的网站上面的新闻,然后存储到数据库当中,,急急急急急急

--------------------编程问答-------------------- 模拟提交,然后自己分析内容,可以用正则,完后入库 --------------------编程问答--------------------
引用 1 楼 bdmh 的回复:
模拟提交,然后自己分析内容,可以用正则,完后入库

版主回复很及时,谢谢了。。。
奈何我是菜鸟一个。。。。。
不会。。 --------------------编程问答-------------------- WebClient + 正则 --------------------编程问答-------------------- 急急急急急
搜索一下类似就不用了 --------------------编程问答-------------------- 1.获取新闻html
2.正则分析你要的内容
3.入库
4.继续执行1 --------------------编程问答-------------------- 获取页面数据,然后正则匹配,参考:http://blog.csdn.net/joyhen/article/details/8814001 --------------------编程问答-------------------- 我之前做过一个天涯脱水版的小工具
httprequest 抓取response 然后解析返回的内容 存储
--------------------编程问答-------------------- http://www.cnblogs.com/ceachy/articles/CSharp_Retrive_Page_Document.html --------------------编程问答-------------------- 根据路径抓取网页html,然后正则匹配需要的内容保存到数据库即可 --------------------编程问答-------------------- 直接模拟一个get请求,先观察对方新闻的url路径特点,然后随机生成地址,也可以找到对方新闻列表地址,然后分析标题的特点,比如他的标题是  <span class="newTitle">XXXX新闻标题</span>,这样你先get这个新闻列表页面,就得到了所有新闻标题和新闻正文的链接地址,同样的道理去get新闻正文地址,分析出新闻的正文,比如正文在 <div class="newContent"></div>里面,那就正则匹配出这些就可以了 --------------------编程问答-------------------- 除 --------------------编程问答-------------------- webbrowser + DOM 解析 +正则 --------------------编程问答-------------------- 同意6楼!我的引用好像不能用了! --------------------编程问答-------------------- http://download.csdn.net/detail/qq289523052/4528063 --------------------编程问答-------------------- http://download.csdn.net/detail/qq289523052/4528063 --------------------编程问答-------------------- 先获取他页面的内容
然后 用正则筛选 你要的,存入数据库

搜索 采集,比较容易找到 --------------------编程问答-------------------- 新人来学习了,好像很牛逼的样子
补充:.NET技术 ,  ASP.NET
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,