首页 > 织梦采集https链接时获取到的网址错误解决办法

织梦采集https链接时获取到的网址错误解决办法

dedecms:采集https链接时获取到的网址错误解决办法

    接上一篇dedecms:采集https链接时却生成http协议请求的解决办法
织梦CMS采集https链接时出错,dedecms采集https链接时获取到的网址错误,如采集来源网址:https://www.hai1678.com/guochandianshiju/,我们想要获取来源网址里的https://www.hai1678.com/guochandianshiju/115969.html,当设置好匹配规则后,测试发现获取的影片网址却是https://www.hai1678.com/guochandianshiju/https://www.hai1678.com/guochandianshiju/115969.html。
解决办法:
将include/dedehtml2.class.php里面的408行
$okurl = $this->BaseUrlPath.'/'.$surl;
修改为
$okurl = preg_replace('/^https:///i', '', $surl)

注意:修改后会导致采集目标站内容页里的分页链接错误,(如:<li>1</li><li><a href="1_2.html">2</a></li>)的分页内容采不了。

DedeCMS推荐
织梦自定义表单地区联动类型不可用的解决办...
织梦UTF-8版本keditor多图上传...
织梦标签array runphp静态生成...
织梦调用问答栏目文章到首页实现方法
织梦采集https链接时却生成http协...
织梦标签dede:arclist输出取消...