爬虫房价交易数据

这是一个作者毕业设计的爬虫,爬取58同城、赶集网、链家、安居客、我爱我家网站的房价交易数据。关于AWK文的使用方法 File_catalog.awk提供了一套处理爬虫数据的算法。算法使用GNU工具awk语言实现

应用介绍

这是一个作者毕业设计的爬虫,爬取58同城、赶集网、链家、安居客、我爱我家网站的房价交易数据

#关于AWK文的使用方法 File_catalog.awk提供了一套处理爬虫数据的算法。算法使用GNU工具awk语言实现。 使用awk程序用此算法处理后数据可以按月和房屋类型拆分为不同文件。 使用方法: Linux/Unix(或者其他可以使用awk程序的平台) awk -f [File_catalog.awk的位置] [需要处理的爬虫数据(文件名必须包含xinfang/ershoufang/zufang,数据第一列必须为年月的六位数字如201604)]

文件列表(部分)

名称 大小 修改日期
File_catalog.awk0.21 KB2016-05-04
scrapy.cfg0.19 KB2016-05-04
items.py0.30 KB2016-05-04
items.pyc0.38 KB2016-05-04
pipelines.py1.08 KB2016-05-04
pipelines.pyc1.23 KB2016-05-04
settings.py1.20 KB2016-05-04
settings.pyc0.27 KB2016-05-04
city.py0.38 KB2016-05-04
city.pyc0.56 KB2016-05-04
ershoufang.py1.21 KB2016-05-04
ershoufang.pyc1.31 KB2016-05-04
startURL.py144.79 KB2016-05-04
startURL.pyc0.67 KB2016-05-04
startURL_cs.py0.31 KB2016-05-04
startURL_cs.pyc0.67 KB2016-05-04
startURL_quanguo.py144.79 KB2016-05-04
startURL_quanguo.pyc145.68 KB2016-05-04
zufang.py1.08 KB2016-05-04
zufang.pyc1.25 KB2016-05-04
__init__.py0.13 KB2016-05-04
__init__.pyc0.12 KB2016-05-04
__init__.py0.00 KB2016-05-04
__init__.pyc0.12 KB2016-05-04
startURL.txt~172.67 KB2016-05-04
startURL_quanguo.txt~90.19 KB2016-05-04
scrapy.cfg0.19 KB2016-05-04
items.py0.30 KB2016-05-04
items.pyc0.35 KB2016-05-04
items.py~0.30 KB2016-05-04

立即下载

相关下载

[磁耦合谐振buckss仿真] 无线电能传输技术可有效地解决电源接入问题,使充电过程便捷、安全,解决了传统依靠电导体直接进行物理接触的电源直接接触式输电模式所带来的插电火花、积碳、不易维护、易产生磨损,特别是在特殊环境下用电存在的安全隐患等问题。
[QT学习日记篇01(1)-QT界面初探- *.pro文件详解] Qt基础课程完结项目,完成一款小游戏并封装:翻金币游戏,通过点击金币进行翻面,让所有金币为同一面就游戏通过进入下一关。 过程中会使用前面学到的 “信号和槽”,“Qt图片资源显示”,“Qt播放音频”,“Qt绘图函数”,“Qt消息控件”等等知识。是一次前面所学知识的汇总。
[MMC模块化多电平换流器常用调制策略的对比分析] 在Matlab/Simulink环境下分别搭建了桥臂数量为6和10的两种调制方法的仿真模型,分析了模块数量与调制方法对输出的正弦电压的影响。
[svpwm同步调制] 同步调制下,通过把载波的频率固定为参考波频率的整数倍,同时固定两者的相位关系。通过这种方法可以消除3的倍数次谐波,并且通过适合pwm波正负半周期对称(N载波比取奇数),消除偶次谐波,总体同步调制所含谐波只为6k+1也就是5 7 11 13次谐波等。
[避雷器comsol仿真] comsol实现避雷器的电,磁,热仿真计算模型
[FPGA车牌识别代码

评论列表 共有 0 条评论

暂无评论

微信捐赠

微信扫一扫体验

立即
上传
发表
评论
返回
顶部