• <div id="4o6yt"></div>

    1. <blockquote id="4o6yt"></blockquote>

      八爪鱼,最好的网络爬虫工具

      如何高效批量获取上市公司的年报数据?

      作者:keven 发布时间:2019/3/8 11:35:50 609 人已阅读

      摘要:最近知乎上有位叫「路过银河」的财经财报会计话题大V写了一篇用八爪鱼东方财富简易模板“批量获取上市公司财报”的文章。干货满满,且有详实的操作步骤可参考。

      ?

      最近知乎上有位叫「路过银河」的财经财报会计话题大V写了一篇用八爪鱼东方财富简易模板“批量获取上市公司财报”的文章

      ?

      干货满满,且有详实的操作步骤可参考。

      ?

      在此特别分享给各位爪爪!以下是原?#27169;?/span>

      ?

      如何高效批量获取上市公司的年报数据?

      ?

      经常看我文章的粉丝都知道我有个自称,叫大表哥。当然,大表哥不是江西人,而?#19988;?#20026;在很多上市公司,从事财务报表工作的人员往往被戏称为表哥、表姐。

      ?

      几年前,大表哥脱离财务,去了法务部门,再也不用加班做报表了。参加工作十多年来,第一个可以休假的元旦,我竟然6点钟就醒了,习惯性的想去加班,然后发现自己已经不是财务人员了。

      ?

      直到有一天,古怪精灵的韭?#21496;?#23545;我说,你帮我看看珠江控股的年报。

      ?

      年报?#35838;?#25797;长啊。于是我去新浪财经、腾讯证券、网易财经、东方财富等网站?#19994;?#20102;这家公司的年报。然后看到了财务人员拙劣的财技,写了一篇文章,给韭?#21496;?#22909;盆友看。

      ?

      再后来,我想看更多上市公司的年报,作为吃Excel饭多年的选手,我很想把它们都整理成统一格式。

      ?

      怎?#31383;歟?/strong>

      ?

      那时候?#19968;?#19981;知道有Wind这种金融客户端,当然更不知?#28010;?#19968;年6万+的服务费。

      ?

      我决定写个爬虫程序。用哪?#38047;?#35328;写比较好呢?

      ?

      查了查论坛,发现有一句话很合?#19994;?#21475;味:Ruby是世界上最好的语言。于是,我去学Ruby。

      ?

      ?

      ?

      一个月后,我写的第一个Ruby爬虫程序可以顺利的跑起来了。

      ?

      从运行情况看,程序还算稳定,从腾讯证券和网易财经获取我想要的数据,然后写到Excel里。

      ?

      ?

      第一个程序读取3000多家上市公司的全部数据要几个小时,考虑到爬取的是所有公司上市以来的所有财报,这个速度也是可以接受的。

      ?

      ?

      ?

      ?

      比?#19979;?#24847;的是,我可以轻松的拿到?#25105;?#26102;间段的?#25105;?#36130;务指标的excel格式。

      ?

      ?

      ?

      但是,过了几天,我又发现了新问题。

      ?

      那就是Ruby太小众了,尤其是遇到财务指标分析的函数时,几乎没有任何资料,英文的都没有。

      ?

      怎?#31383;歟?#20154;生苦短,我用Python。

      ?

      我把Ruby教材放了放,又买了本Python教?#27169;?#20174;零开始学习基本语法。

      ?

      Python的好处是有很多财经库,许多函数不需要自己算,可以直接到库里拿。

      ?

      又过了一个月,?#19994;腜ython程序终于跑起来了。

      ?

      ?

      后来,?#20197;?#30693;乎发帖子对上市公司的财务数据进行大数据总结的时候,有人问我,你不用Wind吗?

      ?

      Wind?#35838;?#19968;脸懵逼。后来在某金融机构的赞助下,我也有了Wind,这是后话。

      ?

      又有人问我,你不是个会计吗?是啊,我是个会计啊,怎么学会编程的?#35838;?#23601;学会了,我也不知道为什?#31383;。?/span>

      ?

      所以,问题就来了,我可能比?#20808;?#26131;的学会编程并且快速的获取这些数据,但是普通的财务人员和投?#25910;?#24590;?#31383;歟?/span>

      ?

      虽然我一直在思考这个问题,但除了花精力学编程或者花钱买Wind,似乎没有太好的办法。

      ?

      在我帮韭?#21496;?#30406;友统计中报预增的数据时,感觉Wind整合的并不算太好,反而倒是免费的东方财富网排序非常好用,我决定把东方财富网的数据爬成Excel。

      ?

      这次我没有用Ruby或者Python,而是找了个好用的爬虫工具—八爪鱼。

      ?

      八爪鱼是什么?章鱼?#35838;?#36156;?

      ?

      八爪鱼是一款免费的专为零基础编程人员设计的网页采集器,凭借自主研发的大规模分布式云采集?#25945;ǎ?#34701;合大数据技术和人工智能技术,可以简单轻松抓取互联网所有公开数据,可以为企业和个人提供数据分析能力和行业场景解决方案,极大地提高个人和企业的效率和竞争力。

      ?

      ?

      ?

      这个工具的风格很合我意,除了实用的功能,一点都不花哨。就差像我一样,用Dos风格的界面了。

      ?

      比如我想批量采集利润表,数据源用东方财富网。

      ?

      ?

      ?

      网站内找所需的具体模板,例如此处的利润表。

      ?

      可看到其采集哪些字段

      ?

      预览要设置的参数

      ?

      示例数据展现模板的采集结果

      ?

      按要求填写日期,支持多个,用回?#21040;?#34892;换行

      ?

      保存并启动云采集

      ?

      静静等待数据,见证奇迹的时刻:

      ?

      ?

      然后导出

      ?

      满满的数据,全都是爱啊

      看到这里,我觉得,本来就是几分钟的工作量,我又何苦去学两个月的Ruby和Python呢?

      ?

      回到Excel,就是我擅长的部分了。

      ?

      ?

      我发现,八爪鱼在知乎还有官方号:

      @八爪鱼采集器(点击可关注)

      ?#34892;?#20320;们,做了个这么好用的工具~~~

      ?

      ?

      ?


      企业试用

      11选五

    2. <div id="4o6yt"></div>

      1. <blockquote id="4o6yt"></blockquote>

      2. <div id="4o6yt"></div>

        1. <blockquote id="4o6yt"></blockquote>