现在的位置: 首页 > 综合 > 正文

尼玛啊,我要斗破苍穹续集全集下载地址啊

2013年10月01日 ⁄ 综合 ⁄ 共 860字 ⁄ 字号 评论关闭

尼玛啊,网上找了半天,没找到斗破续集地址,只有一些部分的那种!我**啊,我要全集下载啊

虽然不提供全集下载,但是网上缺有提供在线阅读的地址,比如:http://www.66721.com/14/14800/

作为一名程序员,是将任何工作都要自动化的,于是乎,想法自然来了,我抓取这个页面的子链接,在抓取子链接里的内容就可以了

php实现具体代码:

$url='http://www.66721.com/14/14800';
	$html=file_get_contents($url);
	preg_match_all('/\<dd\>\<a\shref\=\"(\d{7}\.html)/',$html,$match);
	$links=$match['1'];
	$text='';
	foreach($links as $key=>$vo){
		$html=file_get_contents($url.'/'.$vo);
		preg_match_all('/\<center\>\<span\sstyle\=\"font\-size\:15pt[\s\S]*?\<\/center\>([\s\S]*?)\<\/div\>/',$html,$match);
		$text=$match['1']['0'];
		$text=str_replace(' ','',strip_tags(iconv('gbk','utf-8',trim($match['1']['0']))));
		$text=str_replace('?由提供在线文字版免费阅读(嗜血战刀全文阅读)。',"\n",$text);
		file_put_contents('E:\\txt\\'.intval($key+1).'.txt',$text);
	}

嘿嘿!记得php以cli模式来跑,不要用cgi,cgi会超时,当然,你set_time_limit(0)也可以,

截个图,表示我已经打包好了全部了

下载地址:http://download.csdn.net/detail/zouhao619/5257017

抱歉!评论已关闭.