- 注册时间
- 2012-6-22
- 最后登录
- 2020-11-29
- 阅读权限
- 200
- 积分
- 18282
- 精华
- 6
- 帖子
- 539
  
签到天数: 31 天 [LV.5]常住居民I 151****1798
|
发表于 2013-1-11 16:40:14
|显示全部楼层
在爱飞软件采集规则中,规则标签支持无限组合,并且支持还支持标签的重组(后处理),这边,我们介绍百姓网的电话号码采集方法!- http://quanzhou.baixing.com/shouji/a255094127.html
复制代码 中,电话号码是隐藏的,通过分析网页源代码可以发现,*号显示的电话号码在源代码中,源代码片
段如下:- <em>
- 联系电话:
- </em>
- <strong class="typo-h2 viewad-contact">
- 1896552****
- </strong>
- <small class="viewad-mobilearea">
- (泉州)
- </small>
- <button data-contact="2253" class="show-contact">
- 点击查看完整号码
- </button>
复制代码 我们通过自定义标签,新建一个自定义标签“联系电话”来采集这个电话号码:
字段 | 代码起始块 | 代码结束块 | 采集数据
| 1 | class="typo-h2 viewad-contact" | **** | 1896552
| 2 | data-contact=" | " | 2253 |
最终“联系电话”输出结果为 字段1和2的组合:18965522253
这样我们就采集到了联系电话号码,但是我们还需要同时采集其他字段作为内容发布,可以利用“后处理”来进行内容再次组合。
后处理p语言片段如下,其中软件自动将自定义标签“联系电话”赋值为全局变量,无需重新定义,后继的标签p语言中可以直接调用:- void main(void)
- {
- $m_ncontent=$m_ncontent+"
- 联系电话:"+联系电话;
- }
复制代码 $m_ncontent:正文内容变量
直接显示的字符和换行请用英文引号,最终采集结果如下:
为了便于大家学习,可以下载相关规则:
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册

|