当前位置:编程学习 > JAVA >>

求帮助,怎样获取别人页面上的数据

要怎样才能获取别人页面上的各项数据,http://www.autohome.com.cn/373/options.html,比如获取这个页面里的发动机型号。。。求大神帮忙 java,网页 --------------------编程问答-------------------- 第一步,通过URL获取html网页内容。
第二步,用正则表达式去截取你所需要的内容。
最后,如果你所需要的数据时动态JS生成的,那就木办法了。 --------------------编程问答-------------------- 首先通过http协议获取指定url地址的网页信息,然后解析html内容即可。可以参考http://blog.csdn.net/kingmaxno1/article/details/3273764 --------------------编程问答--------------------
引用 1 楼 AA5279AA 的回复:
第一步,通过URL获取html网页内容。
第二步,用正则表达式去截取你所需要的内容。
最后,如果你所需要的数据时动态JS生成的,那就木办法了。

正则表达式,爬取需要的数据。 --------------------编程问答-------------------- 我是来走歪门邪路的,网页字符抓取工具! --------------------编程问答-------------------- 这个能抓取到网页内容,具体需要的信息再解析builder就行了。

        HttpURLConnection httpConn = (HttpURLConnection) new URL("http://www.autohome.com.cn/373/options.html").openConnection();
        InputStreamReader input = new InputStreamReader(httpConn.getInputStream(), "gb2312");
        BufferedReader reader = new BufferedReader(input);
        String line = "";
        StringBuilder builder = new StringBuilder();
        while ((line = reader.readLine()) != null) {
            builder.append(line).append("\r\n");
        }
        System.out.println(builder.toString());
补充:Java ,  Java相关
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,