首先通过爬虫采集链家网上所有南京二手房的房源数据,并对采集到的数据进行清洗;然后,对清洗后的数据进行可视化分析,探索隐藏在大量数据背后的规律;最后,采用一个聚类算法对所有二手房数据进行聚类分析,并根据聚类分析的结果,将这些房源大致 ...
本书第1版出版于2012年,彼时基于 Python 的开源数据分析库(例如 pandas)仍然是一个发展迅速的新事物,本书也成为该领域排名No1的经典畅销书,前两版中文版累计销售近30万册。 第3版针对 Python3.10 和 pandas1.4 进行了更新,并通过实操讲解和实际案例向读者展示 ...
如何批量提取pdf文件名到excel?在现代职场中,处理大量PDF文件是一项常见的任务。这些文件可能包括合同、报告、发票等,归档和管理这些文件的工作常常耗费时间和精力。批量提取PDF文件名到Excel是一个高效的解决方案,可以帮助我们更好地整理和检索文件信息 ...
时隔5年,《利用Python进行数据分析》在2022年9月20日推出了最新的第3版。在此次新版“鼹鼠书”中,Wes亲自讲解了最新的1.4版的Pandas。这次,很高兴能受邀翻译第3版的《利用Python进行数据分析》,22年11月底翻译好了本书,还有不到一个月,这本书应该就快能付梓啦 ...