7x24快讯 ·

超级大资源 | 数据工程师的衣柜

今天,给大家介绍一个数据工程(注:非qq不断发红包的群号码)资源超级大列表,你想找的全部在这儿~(Github链接见文末)

这个资料集是由区块链公司POA Network的技术负责人Igor Barinov所制作的。资源本身并没有代码之类的内容,而是为大家总结了数据工程上必要工具的链接,包含了从数据库到并行处理,再到数据集等一系列内容。每一项分类下都有清楚的链接和简介。

这个资源集的目录如下:

?

?

着实是很全面的一个列表,从事数据工程的同学应该很熟悉。

这个列表的内容有多详细呢?我们可以看一下关系数据库(relational database)的例子来窥斑见豹:

?

?

可以看到,仅仅是关系数据库这一项,作者就总结出了一份很齐全的工具列表,包括了MySQL、PostgreSQL等大家熟悉的工具,也有其它稍微陌生一点的名字。而MySQL下面也附着了基于MySQL协议的相关工具。

在整个数据库(Databases)的大板块下,其他的数据库模型(Key-Value、Column、Document、Graph、Distributed、Timeseries、Others)也被如此详细地总结出来。其他的大板块亦是如此。

此外,列表的最后还有一个社区的板块,包含了论坛、会议和Podcast的链接:

?

?

有没有厉害的同学要给这个列表进行补充呢?

Github链接:https://github.com/igorbarinov/awesome-data-engineering

参与评论