作者: 周萝卜
来源:萝卜大杂烩
年终岁尾了,编程语言也要决出这一年的最佳语言了,会是谁呢,从 TIOBE 上来看,Java、C 和 Python 基本锁定了前三的位置,Java 江湖老大的地位,还是无人能撼动呢。
下面先来一张 TIOBE 网站的走势图,镇楼(这是个暴露年龄的词语)!
数据获取的部分,与上一篇 DB 篇很类似,都是解析 JavaScript 代码里的变量,抽出数据即可
def get_pl_data(name): name_lower = [i.lower() for i in name] for i in name_lower: print("Request ", i) if i == 'c#': i = 'csharp' url = 'https://www.tiobe.com/tiobe-index/' + i res = requests.get(url).text content = BeautifulSoup(res, "html.parser") js = content.find_all('script')[9].string src_text = js2xml.parse(js) src_tree = js2xml.pretty_print(src_text) data_tree = BeautifulSoup(src_tree, 'html.parser') array_list = data_tree.find_all('array') data_list = [] for array in array_list[3:]: array_data = array.find_all('number') data_list.append({'date': array_data[0]['value'] + '-' + array_data[1]['value'] + '-' + array_data[2]['value'], 'value': array_data[3]['value']}) save_data(i, data_list)
当然这里还是提前获取了前50名编程语言的列表,直接通过 pandas 的 read_html 方法就可以方便的获取
def get_pl_list(): url = 'https://www.tiobe.com/tiobe-index/' pl_df = pd.read_html(url) top_20 = pl_df[0]['Programming Language'].values.tolist() bottom_30 = pl_df[1]['Programming Language'].values.tolist() return top_20 + bottom_30
最后再保存到 csv 中
with open('pl_data.csv', 'a+', encoding='utf-8') as f: f.write('name,value,date/n') for d in data: try: row = '{},{},{}'.format(name, d['value'], d['date']) f.write(row) f.write('/n') except: raise
如果不出意外的话,几分钟的时间里,我们就能够拿到近20年编程语言的风云数据啦!
我们先来看看2019年,各大编程语言的总体排名,其实从上面镇楼曲线图中也是可以看出来的,但是不是特别的直观,我们转换成柱状图来看看
可以看出虽然这一年里 Python 大红大紫,但是根据 TIOBE 的统计来看,其搜索占有率还是远远低于 Java 和 C 的,不过其第三名的位置还是比较稳固的!
而 Java 和 C,这两位语言界的大佬,已经相爱相杀了多年了,直到如今也没有完全分出高低。
由谷歌力挺的 Go 语言,似乎有些放缓了前进的步伐,第15位,不太符合其天之骄子的身份呢。
而对于世界第一语言 PHP 来说,在这个微服务兴起,前后端分离盛行的时代,活着就是最好的!
下面我们来分别看一看榜单的前五大语言的排名走势情况
Java 的2019
2019 年的 Java,有一种稳中取胜的感觉,作为生态最为庞大的语言,其强大的造新能力确保了江湖地位,要说企业里后端的第一语言,绝对非 Java 莫属!
C 的2019
2019 年的 C,还是有着不错的增长的,虽然在年末的两个月表现不佳,但是这也足以确保第二的位置了,相信这门“古老”的语言在未来仍然是不可忽视的力量!
Python 的2019
随着2018年人工智能的兴起,Python 已经大火了一把,而进入2019年,这种势头仍然没有减弱,凭借着简洁易懂学习曲线平滑等特点,Python 成为了更多人的首选语言。
C++ 的2019
C ++ 这一年的表现似乎不是太好,当然在嵌入式领域,它还是老大。同时作为 C 语言的超集,前途无限光明。
C# 的2019
C# 在这一年有着非常不错的增长,隐隐有超越 C++ 的趋势,估计这还是和微软逐渐拥抱开源息息相关吧,毕竟现在的微软已经是 GitHub 上的第一大开源组织了!
接下来我们看下榜单上6-10名编程语言的全年走势情况
可以看出,除了 .Net 语言下滑的较为明显之外,其他的语言包括 PHP、SQL、Swift 和 JS 等都变化不大,相互之间的位置也没有太大变化,大家相安无事!
首先是11-15名的曲线走势
在这份榜单中,各个语言的变化就比较大了,比如说 Objective-C 最高时能达到1.8%,如果保持住的话,都可以挤进前十了。而业界一致看好的 Go 语言呢,最高也有1.4%多,只不过在几经起落之后,最终定格在0.9%,不禁令人唏嘘!
再来看看16-20名的曲线走势
最后,我们来看看榜首的五大语言占比情况吧
从图中不难看出,榜首的五大语言,基本占去了搜索比重的一半以上,如果再加上 .Net 和 JavaScript 两大语言,基本上程序猿的世界里,就是它们了。
当然了,语言火是一回事,薪资高不高又是另一回事了,简单的抓取了拉勾上每个语言前三页岗位的薪资情况,大家来体会下
最后还是以一个视频结束,20年语言风云榜,你值得拥有!
后台回复“PL”获取完整的数据抓取和可视化代码!
“
作者:周萝卜,Python 学习者。爱好爬虫、数据分析及可视化等,个人公众号《萝卜大杂烩》,期待与你相遇~
”
◆ ◆ ◆ ◆ ◆
数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里 交流关于数据分析&数据挖掘的相关内容, 还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。
猜你喜欢
● 笑死人不偿命的知乎沙雕问题排行榜
● 我用Python纪念了那些被烂片收割的智商税!
● 互联网大佬学历&背景大揭秘,看看是你的老乡还是校友
● 上万条数据撕开微博热搜的真相!
● 你相信逛B站也能学编程吗?