设为首页收藏本站

爱飞SEO软件 -- 助站长腾飞!!!

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博账号登陆

只需一步,快速开始

从这里开始1.注册账号-->2.下载软件-->3.查看教程-->4.求助咨询 免费使用全部功能 官方qq群:爱飞seo软件交流

搜索
查看: 5482|回复: 42

[教程] 采集规则 自定义标签的组合使用(含p语言)

[复制链接]

64

主题

975

好友

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

签到天数: 31 天

[LV.5]常住居民I

151****1798

社区QQ达人 宣传达人

发表于 2013-1-11 16:40:14 |显示全部楼层
在爱飞软件采集规则中,规则标签支持无限组合,并且支持还支持标签的重组(后处理),这边,我们介绍百姓网的电话号码采集方法!
  1. http://quanzhou.baixing.com/shouji/a255094127.html
复制代码
中,电话号码是隐藏的,通过分析网页源代码可以发现,*号显示的电话号码在源代码中,源代码片

段如下:
  1. <em>
  2. 联系电话:
  3. </em>
  4. <strong class="typo-h2 viewad-contact">
  5. 1896552****
  6. </strong>
  7. <small class="viewad-mobilearea">
  8. (泉州)
  9. </small>
  10. <button data-contact="2253" class="show-contact">
  11. 点击查看完整号码
  12. </button>
复制代码
我们通过自定义标签,新建一个自定义标签“联系电话”来采集这个电话号码:



字段代码起始块代码结束块采集数据
1class="typo-h2 viewad-contact"****1896552
2data-contact=""2253

最终“联系电话”输出结果为 字段1和2的组合:18965522253

这样我们就采集到了联系电话号码,但是我们还需要同时采集其他字段作为内容发布,可以利用“后处理”来进行内容再次组合。

后处理p语言片段如下,其中软件自动将自定义标签“联系电话”赋值为全局变量,无需重新定义,后继的标签p语言中可以直接调用:
  1. void main(void)
  2. {
  3. $m_ncontent=$m_ncontent+"
  4. 联系电话:"+联系电话;
  5. }
复制代码
$m_ncontent:正文内容变量
直接显示的字符和换行请用英文引号,最终采集结果如下:



为了便于大家学习,可以下载相关规则:
游客,如果您要查看本帖隐藏内容请回复


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博账号登陆

[发帖际遇]: 一个袋子砸在了 admin 头上,admin 赚了 6 铜钱. 幸运榜 / 衰神榜
踩过的脚印