数据职位

Chinese, Simplified
SEO Title
data position

大数据工程师

Chinese, Simplified

大数据工程师的职业生涯需要教育和工作经验,许多专业人士选择获得认证。了解大数据工程师的工作内容、工作机会以及如何入门。


如果你对以下任何一个主题感兴趣,那么大数据工程师可能是一个不错的职业选择:数据、数学、分析、解决问题、数字、图表和IT。

这篇文章将分解成为一名大数据工程师的所有关键方面。看完之后,你应该对这份职业是否适合你有一个更好的想法。

什么是大数据工程师?


大数据工程师是负责开发、维护、测试、分析和评估公司数据的专业人员。大数据是指极其庞大的数据集。在现代经济中,公司在进行业务运营的整个过程中收集大量数据是很常见的。

如果使用得当,大数据对组织非常有益,可以帮助它们提高效率、盈利能力和可扩展性。然而,除非有大数据工程师来构建收集、维护和提取数据的系统,否则公司的大数据是没有帮助的。因此,大数据工程师最终有责任帮助公司管理其大数据。

大数据工程师与数据科学家


大数据工程师和数据科学家之间最显著的区别在于,大数据工程师主要负责构建和维护收集和提取数据的系统和流程。数据科学家分析清理后的数据以产生见解,使用各种预测模型来产生有意义的见解。

典型工作职责


以下所有内容都是大数据工程师的典型工作职责:

  • 设计和实现软件系统
  • 创建收集数据和处理数据的系统
  • 使用提取转换加载操作(ETL过程)
  • 创建满足业务需求的数据体系结构
  • 研究获取有价值数据并提高数据质量的新方法
  • 使用各种编程语言和工具创建结构化数据解决方案
  • 从多个领域挖掘数据以构建高效的业务模型
  • 与数据分析师、数据科学家和其他团队合作

工资和工作前景


根据ZipRecruiter的数据,一名大数据工程师的平均工资为125662美元[1]。经验丰富的大数据工程师在职业生涯的后期可以赚更多的钱。然而,那些刚进入该领域但经验不高的人可能会赚得更少。

劳工统计局(BLS)将大数据工程师的职位划分为统计学家、计算机和信息研究科学家。以下是这两类人的就业前景:

统计学家:2021年至2031年,预计就业增长31%[2]

计算机和信息研究科学家:预计2021年至2031年间就业增长21%[3]

根据劳工统计局的预测,未来几年,大数据工程师的工作需求可能会大幅增加,这使这一职业成为一条很好的职业道路。
大数据工程师的随需应变技能


大数据工程师通常具备以下所有技能:

  • 使用C++、Java和Python等语言进行计算机编程
  • 数据库和SQL
  • ETL和数据仓库
  • Talend、IBM DataStage、Pentaho和Informatica
  • Unix、Linux、Windows和Solaris的操作系统知识
  • Hadoop
  • Apache Spark
  • 数据挖掘和建模

如何成为一名大数据工程师


大多数人在成为大数据工程师的过程中需要完成几个步骤。

1.获得学位。


如果你想成为一名大数据工程师,你必须掌握上述所有技术技能,这意味着你需要接受大量的教育。许多成为大数据工程师的人都拥有计算机科学、统计学或商业数据分析等相关领域的学士和硕士学位。

大数据工程师需要精通编码、统计和数据。大多数公司都要求获得大数据工程师职位的学士学位。

阅读更多:获得学士学位需要多长时间?
 

2.获得工作经验。


经验是获得大数据工程师工作的宝贵财富。你可以通过自由职业、实习、独立执业或在相关职位上工作来获得经验。你获得的经验越多,获得大数据工程师职位的机会就越大。

 

3.考虑认证。


获得专业证书对于获得大数据工程师的就业也非常有利。以下证书中的每一个都可以帮助那些试图成为大数据工程师的人:

  • Cloudera认证专家(CCP)数据工程师
  • 大数据认证专家(CBDP)
  • 谷歌云认证专业数据工程师
  • IBM数据科学专业证书
  • IBM数据工程专业证书
本文地址
https://architect.pub/big_data_engineer
SEO Title
Big Data Engineer

数据分析师

Chinese, Simplified

数据分析师收集、清理和研究数据集以帮助解决问题。以下是你如何开始走上一条成为一体的道路。


数据分析师收集、清理和解释数据集,以回答问题或解决问题。他们在许多行业工作,包括商业、金融、刑事司法、科学、医学和政府。

企业在下一次广告活动中应该瞄准什么样的客户?哪个年龄段最容易感染某种特定疾病?哪些行为模式与财务欺诈有关?

作为一名数据分析师,你可能会被迫回答这些类型的问题。继续阅读,了解更多关于什么是数据分析师、你需要什么技能以及如何开始成为数据分析师的信息。


通过谷歌数据分析专业证书,探索数据分析师的职业道路。学习关键的分析技能,如数据清理、分析和可视化,以及电子表格、SQL、R编程和Tableau等工具。


什么是数据分析?


数据分析是从数据中收集见解,为更好的商业决策提供信息的过程。分析数据的过程通常经过五个迭代阶段:

  • 确定要分析的数据
  • 收集数据
  • 清理数据,为分析做准备
  • 分析数据
  • 解释分析结果

数据分析可以采取不同的形式,这取决于你试图回答的问题。您可以在此处阅读有关数据分析类型的更多信息。简言之,描述性分析告诉告诉我们为什么发生,预测性分析形成了对未来的预测,规定性分析创建了关于采取什么行动的可行建议。
数据分析师的任务和职责
数据分析师的工作是收集和解释数据以解决特定问题。这个角色包括花大量时间处理数据,但也需要交流研究结果。

以下是许多数据分析师每天的工作:

  • 收集数据:分析师通常自己收集数据。这可能包括进行调查、跟踪公司网站上的访问者特征,或从数据收集专家那里购买数据集。
  • 干净数据:原始数据可能包含重复、错误或异常值。清理数据意味着保持电子表格或编程语言中的数据质量,这样你的解释就不会出错或失真。
  • 模型数据:这需要创建和设计数据库的结构。您可以选择要存储和收集的数据类型,确定数据类别如何相互关联,并研究数据的实际显示方式。
  • 解释数据:解释数据将涉及到在数据中找到可以回答手头问题的模式或趋势。
  • 现在:交流你的调查结果将是你工作的关键部分。要做到这一点,您可以将图表等可视化工具组合在一起,编写报告,并向感兴趣的各方展示信息。

数据分析师使用什么工具?


在数据分析过程中,分析师经常使用各种各样的工具来提高工作的准确性和效率。数据分析行业中一些最常见的工具包括:

  • Microsoft Excel

  • Google Sheets

  • SQL

  • Tableau

  • R or Python

  • SAS

  • Microsoft Power BI

  • Jupyter Notebooks

数据分析师薪酬和工作前景


Glassdoor的数据显示,2021年12月,美国数据分析师的平均底薪为69517美元。这取决于你的资历、你在美国的位置以及其他因素。

数据分析师的需求量很大。世界经济论坛将其列为美国就业增长的第二位[1]。劳工统计局还报告称,相关职业的增长率极高。

从2020年到2030年,运筹学分析师职位预计将增长25%,市场研究分析师职位预计增长22%,数学家和统计学家职位预计增长33%。这远高于7.7%的总就业增长率。

数据分析师与数据科学家:有什么区别?


数据分析师和数据科学家都处理数据,但他们处理数据的方式不同。数据分析师通常使用现有数据来解决已定义的业务问题。数据科学家建立新的算法和模型来预测未来。进一步了解数据科学家和数据分析师之间的区别。

数据分析师的类型


随着技术的进步,我们可以收集的信息类型和数量迅速扩大,了解如何收集、分类和分析数据已成为几乎任何行业的关键部分。你可以在刑事司法、时尚、食品、技术、商业、环境和公共部门等领域找到数据分析师。

执行数据分析的人可能有其他头衔,例如:

  • 医疗保健分析员
  • 市场研究分析师
  • 业务分析师
  • 商业智能分析师
  • 运筹学分析师
  • 情报分析员


如何成为一名数据分析师


通往数据分析师职业生涯的道路不止一条。无论你是刚从学校毕业还是想转行,第一步通常是评估你拥有哪些可转移的技能,并培养你在这个新角色中需要的新技能。

数据分析师技术技能


数据库工具:Microsoft Excel和SQL应该是任何数据分析师工具箱中的支柱。虽然Excel在各个行业中无处不在,但SQL可以处理更大的数据集,并被广泛认为是数据分析的必要条件。

  • 编程语言:学习Python或R等统计编程语言可以处理大量数据并执行复杂的方程。尽管Python和R是最常见的语言之一,但最好看看你感兴趣的职位的几个职位描述,以确定哪种语言对你的行业最有用。
  • 数据可视化:以清晰而引人注目的方式展示您的发现对于成为一名成功的数据分析师至关重要。了解如何最好地通过图表呈现信息,将确保同事、雇主和利益相关者了解您的工作。Tableau、Jupyter Notebook和Excel是用于创建视觉效果的众多工具之一。
  • 统计和数学:了解数据工具实际操作背后的概念将对你的工作有很大帮助。扎实掌握统计和数学将帮助你确定哪些工具最适合解决特定问题,帮助你发现数据中的错误,并更好地理解结果。

如果这看起来很多,不要担心——有很多课程会教你作为数据分析师所需的基本技术技能。Coursera上的这门IBM数据分析师专业证书课程是一个很好的起点。


数据分析师工作技能


  • 问题解决:数据分析师需要对所提出的问题和需要解决的问题有很好的理解。他们还应该能够找到可能揭示故事的模式或趋势。拥有批判性思维技能将使你能够专注于正确类型的数据,识别最具启发性的分析方法,并找出工作中的差距。
  • 沟通:能够将你的想法传达给其他人对你作为数据分析师的工作至关重要。作为一名数据分析师,具备与同事和其他利益相关者沟通的良好书面和口头技能。
  • 行业知识:了解你所从事的行业——医疗保健、商业、金融或其他——会让你在工作和求职中占据优势。如果你想进入一个特定的行业,花点时间关注你所在行业的新闻,或者读一本关于这个主题的书。这可以使您熟悉行业的主要问题和趋势。


成为数据分析师的途径


掌握这些技能是成为数据分析师的第一步。以下是一些你可以采取的路线,这些路线足够灵活,适合你的生活。

  • 专业证书:入门级专业证书项目通常不需要以前在该领域的经验。他们可以教你SQL或统计学等基本技能,同时让你有机会为你的投资组合创建项目,并对你的工作提供实时反馈。Coursera上的几个专业证书项目正是这样做的。
  • 学士学位:劳工统计局建议涉及数据分析的工作应获得学士学位。如果你正在考虑获得一个学位,成为一名数据分析师,那么把你的课程重点放在统计学、数学或计算机科学上,可以让你在潜在雇主面前领先一步。许多在线学士学位都有灵活的时间表,所以你可以根据自己的优先事项来安排学位。
  • 自学:如果你想要一条不包括正式培训的道路,你可以自己学习数据分析所需的技能。开始使用此数据分析初学者阅读列表。一旦你准备好开始构建投资组合,这里有一些数据分析项目的想法。

有关如何成为数据分析师(有学位或没有学位)的更多信息,请查看我们的分步指南。

数据分析师职业发展


成为一名数据分析师也可以为其他职业打开大门。许多刚开始是数据分析师的人后来成为了数据科学家。与分析师一样,数据科学家使用统计学、数学和计算机科学来分析数据。然而,科学家可能会使用先进的技术建立模型和其他工具来洞察未来趋势。

本文地址
https://architect.pub/data_analyst
SEO Title
data analyst

数据工程师

Chinese, Simplified

数据工程师职位简介

 

  • 数据工程师是构建和维护数据系统的人。
  • 为了吸引最符合您需求的数据工程师,编写清晰准确的数据工程师职位描述非常重要。

数据工程师职位描述

 

  • 我们正在寻找一位积极进取且经验丰富的数据工程师加入我们的团队!作为数据工程师,您将负责构建和维护内部和外部数据馈送和数据管道。

数据工程师的职责

  •  
  • 设计和开发数据模型和管道
  • 管理各种数据存储和数据管理系统
  • 不断提高数据的可靠性和质量
  • 进行数据分析
  • 准备数据报告
  • 识别改进机会
  • 为其他团队成员提供技术指导

数据工程师的要求和资格

 

  • 至少拥有计算机科学、数据科学或类似领域的学士学位
  • 至少 X 年编写数据模型和算法的经验
  • 有软件开发经验
  • 有数据架构和数据建模经验
  • 使用数据可视化和报告工具的经验
  • 优秀的口头和书面沟通技巧
  • 强大的分析能力
  • 高度重视细节
  • 强大的解决问题的能力
  • 能够在团队环境中工作
  • 能够在快节奏的环境中工作

大数据正在改变我们的业务方式,并产生了对能够收集和管理大量数据的数据工程师的需求。
数据工程是设计和构建用于大规模收集、存储和分析数据的系统的实践。这是一个广泛的领域,几乎在每个行业都有应用。组织有能力收集大量数据,他们需要合适的人员和技术来确保数据在到达数据科学家和分析师手中时处于高度可用的状态。

除了让数据科学家的生活更轻松之外,作为一名数据工程师,你还可以有机会在一个到2025年我们每天将产生463 EB的世界上有所作为[1]。这是相当于1和18个零字节的数据。如果没有数据工程师来处理和传输数据,机器学习和深度学习等领域就无法成功。

在本文中,您将了解更多关于数据工程师的信息,包括他们的工作、收入以及如何成为一名数据工程师。但是,如果你想立即开始向在职专业人士学习,可以考虑参加IBM的数据工程导论课程。

数据工程师是做什么的?


数据工程师在各种环境中工作,构建收集、管理原始数据并将其转换为可用信息的系统,供数据科学家和业务分析师进行解释。他们的最终目标是使数据可访问,以便组织可以使用它来评估和优化其性能。

数据工程师在处理数据时可能执行的一些常见任务包括:

  • 获取符合业务需求的数据集
  • 开发算法,将数据转换为有用的、可操作的信息
  • 构建、测试和维护数据库管道体系结构
  • 与管理层合作,了解公司目标
  • 创建新的数据验证方法和数据分析工具
  • 确保遵守数据治理和安全策略

在较小的公司工作通常意味着以多面手的角色承担更多种类的数据相关任务。一些较大的公司有专门用于构建数据管道的数据工程师,而另一些公司则专注于管理数据仓库——既用数据填充仓库,又创建表模式来跟踪数据的存储位置。

数据分析师和数据工程师有什么区别?


数据科学家和数据分析师分析数据集以收集知识和见解。数据工程师构建用于收集、验证和准备高质量数据的系统。数据工程师收集和准备数据,数据科学家利用这些数据来促进更好的商业决策。
 

为什么要从事数据工程?


这一领域的职业既有回报,也有挑战。你将在组织的成功中发挥重要作用,为数据科学家、分析师和决策者提供更容易的数据访问。您将依靠编程和解决问题的技能来创建可扩展的解决方案。

只要有数据需要处理,就会需要数据工程师。事实上,Dice Insights在2019年报告称,数据工程是科技行业最热门的工作,击败了计算机科学家、网络设计师和数据库架构师[2]。领英将其列为2021年增长中的工作之一[3]。

数据工程师工资


数据工程也是一个高薪职业。Glassdoor(2024年3月)[4]的数据显示,美国的平均基本工资为119985美元,一些数据工程师的年收入高达185000美元。

数据工程师职业道路


数据工程并不总是一个入门级的角色。相反,许多数据工程师一开始是软件工程师或商业智能分析师。随着你职业生涯的发展,你可能会进入管理岗位,或者成为数据架构师、解决方案架构师或机器学习工程师。
 

如何成为一名数据工程师


有了正确的技能和知识,你可以在数据工程领域开创或推进一个有回报的职业生涯。许多数据工程师都拥有计算机科学或相关领域的学士学位。通过获得学位,你可以在这个快速发展的领域建立所需的知识基础。考虑攻读硕士学位,以获得提升职业生涯和释放潜在高薪职位的机会。

除了获得学位,你还可以采取其他几个步骤来为自己的成功做好准备。
 

1.培养你的数据工程技能。


学习云计算的基础知识、编码技能和数据库设计,以此作为数据科学职业生涯的起点。

  • 编码:精通编码语言对这个角色至关重要,所以可以考虑参加课程来学习和练习你的技能。常见的编程语言包括SQL、NoSQL、Python、Java、R和Scala。
  • 关系数据库和非关系数据库:数据库是最常见的数据存储解决方案之一。您应该熟悉关系数据库和非关系数据库,以及它们的工作方式。
  • ETL(提取、转换和加载)系统:ETL是将数据从数据库和其他源移动到单个存储库(如数据仓库)的过程。常见的ETL工具包括Xlenty、Stitch、Alooma和Talend。
  • 数据存储:并非所有类型的数据都应该以相同的方式存储,尤其是在涉及大数据时。例如,当您为公司设计数据解决方案时,您会想知道何时使用数据湖与数据仓库。
  • 自动化和脚本:自动化是处理大数据的必要组成部分,因为组织能够收集如此多的信息。您应该能够编写脚本来自动执行重复的任务。
  • 机器学习:虽然机器学习更受数据科学家的关注,但掌握基本概念有助于更好地理解团队中数据科学家的需求。
  • 大数据工具:数据工程师不仅仅使用常规数据。他们通常负责管理大数据。工具和技术在不断发展,并因公司而异,但一些流行的工具和技术包括Hadoop、MongoDB和Kafka。
  • 云计算:随着公司越来越多地用物理服务器换取云服务,您需要了解云存储和云计算。初学者可以考虑参加亚马逊网络服务(AWS)或谷歌云的课程。
  • 数据安全:虽然一些公司可能有专门的数据安全团队,但许多数据工程师的任务仍然是安全地管理和存储数据,以防止数据丢失或被盗。

想知道从哪里开始?
通过Coursera上的这些热门课程培养与工作相关的数据工程技能。

要学习Python,可以考虑报名参加密歇根大学的Python for Everyone Specialization。如果您有兴趣了解更多关于数据库和数据库管理的知识,请尝试Meta的数据库导论或IBM的关系数据库导论(RDBMS)课程。

如果您需要建立对机器学习的理解,请探索Open。人工智能和斯坦福大学的机器学习专业。
 

2.获得认证。


证书可以向潜在雇主验证你的技能,而准备证书考试是发展你的技能和知识的好方法。选项包括大数据助理工程师、Cloudera认证专业数据工程师、IBM认证数据工程师或谷歌云认证专业数据工程师。

查看一些你可能想申请的职位列表。如果您注意到某个特定的证书经常按要求或建议列出,那么这可能是一个很好的起点。
 

3.建立数据工程项目组合。


投资组合通常是求职的关键组成部分,因为它向招聘人员、招聘经理和潜在雇主展示了你能做什么。

你可以将自己独立完成的数据工程项目或作为课程的一部分添加到公文包网站(使用Wix或Squarespace等服务)。或者,将您的作品发布到LinkedIn个人资料的项目部分或GitHub等网站,这两个网站都是独立投资组合网站的免费替代品。


 

4.从入门级职位开始。


许多数据工程师一开始都是初级职位,如商业智能分析师或数据库管理员。随着经验的积累,你可以掌握新技能,并有资格担任更高级的角色。请参阅Coursera中的数据工程职业学习路径的可能学习之旅示例。

我需要学位才能成为一名数据工程师吗?


成为一名数据工程师没有必要拥有学位,尽管一些公司可能更喜欢至少拥有学士学位的候选人。如果你对数据工程感兴趣并计划攻读学位,可以考虑主修计算机科学、软件工程、数据科学或信息系统。

一些学士学位课程专注于数据工程。例如,伦敦大学的计算机科学理学学士学位开设了数据库和高级数据技术的可选模块。


接下来的步骤


从今天开始学习数据工程,学习来自行业领导者和世界一流大学的这些顶级课程:

对于初级课程,请尝试IBM数据工程专业证书。在完成动手实验室和项目的同时,学习基本的数据工程技能和工具,如Python和SQL。

为了准备获得行业认可的认证,请探索谷歌云在GCP专业化方面的数据工程、大数据和机器学习。该中级课程提供支持谷歌云专业数据工程师认证的培训。

为了提升你的职业生涯,可以考虑获得计算机科学学士或硕士学位。尽管并非总是被要求,但雇主通常会寻找拥有计算机科学学位的求职者。在线浏览伦敦大学的学士学位或科罗拉多大学博尔德分校的硕士学位。

本文地址
https://architect.pub/data_engineer
SEO Title
data engineer

数据科学家

Chinese, Simplified

数据科学家使用数据来理解和解释他们周围的现象,并帮助组织做出更好的决策。
作为一名数据科学家,在智力上具有挑战性,在分析上令人满意,并使你处于新技术进步的前沿。随着大数据在组织决策方式中越来越重要,数据科学家变得越来越普遍,需求也越来越大。下面我们来仔细看看他们是什么,做什么,以及如何成为一个。


数据科学家是做什么的?


数据科学家确定他们的团队应该问的问题,并找出如何使用数据回答这些问题。他们经常开发用于理论化和预测的预测模型。

数据科学家可能每天都要完成以下任务:

  • 在数据集中查找模式和趋势以揭示见解
  • 创建算法和数据模型以预测结果
  • 使用机器学习技术来提高数据或产品的质量
  • 向其他团队和高级员工传达建议
  • 在数据分析中部署Python、R、SAS或SQL等数据工具
  • 掌握数据科学领域的创新

数据分析师与数据科学家:有什么区别?


数据分析师和数据科学家的工作可能看起来很相似——他们都能发现数据的趋势或模式,揭示组织更好地决策运营的新方法。但数据科学家往往承担更多的责任,通常被认为比数据分析师更资深。

数据科学家通常会对数据提出自己的问题,而数据分析师可能会支持已经设定目标的团队。数据科学家还可能花费更多时间开发模型、使用机器学习或结合高级编程来查找和分析数据。
数据科学家的薪水和工作增长
根据Lightcast™[1]的数据,数据科学家在美国的平均工资为108659美元。

对数据专业人员的需求很高——根据美国劳工统计局的数据,数据科学家的职业预计在未来10年内增长36%(远高于平均水平)[2]。

高需求与大数据的兴起及其对企业和其他组织日益重要有关。

如何成为一名数据科学家


成为一名数据科学家通常需要一些正式的培训。以下是一些需要考虑的步骤。

1.获得数据科学学位。


雇主通常喜欢看到一些学术证书,以确保你有处理数据科学工作的专业知识,尽管这并不总是必需的。也就是说,相关的学士学位肯定会有所帮助——试着学习数据科学、统计学或计算机科学,以在该领域取得进展。
 

2.提高相关技能。


如果你觉得自己可以提高一些硬数据技能,可以考虑参加一门在线课程或参加相关的训练营。以下是你想要掌握的一些技能。

  • 编程语言:数据科学家可能会花时间使用编程语言对大块数据进行排序、分析和管理。数据科学的流行编程语言包括:
  • 数据可视化:能够创建图表是数据科学家的重要组成部分。熟悉以下工具应能使您做好工作准备:
  • 机器学习:将机器学习和深度学习融入你作为数据科学家的工作中,意味着不断提高你收集的数据的质量,并有可能预测未来数据集的结果。机器学习课程可以让你从基础知识开始。
  • 大数据:一些雇主可能希望看到你对处理大数据有一些熟悉。一些用于处理大数据的软件框架包括Hadoop和Apache Spark。
  • 沟通:如果科学家不能很好地沟通他们的发现,那么最优秀的数据就无法影响任何变化。以口头和书面语言分享想法和结果的能力是数据科学家经常寻求的技能。
     

3.找一份入门级的数据分析工作。


尽管成为一名数据科学家有很多途径,但从相关的入门级工作开始可能是一个很好的第一步。寻找与数据密切相关的职位,如数据分析师、商业智能分析师、统计学家或数据工程师。从那里开始,你可以在扩展知识和技能的同时,努力成为一名科学家。


4.为数据科学访谈做准备。


有了几年的数据分析工作经验,你可能会觉得自己已经准备好进入数据科学领域了。一旦你在面试中取得了分数,就要准备好面试中可能出现的问题的答案。

数据科学家的职位可能具有高度的技术性,因此您可能会遇到技术和行为问题。两者兼而有之,通过大声说出你的答案来练习。从你过去的工作或学术经历中准备例子可以帮助你在面试官面前显得自信和知识渊博。

以下是您可能遇到的几个问题:

  • 线性模型的优点和缺点是什么?
  • 什么是随机森林?
  • 如何使用SQL查找数据集中的所有重复项?
  • 描述你的机器学习经验。
  • 举一个你遇到一个不知道如何解决的问题的例子。你做了什么?
     
本文地址
https://architect.pub/data_scientist
SEO Title
data scientist

【数据科学】如何创建出色的数据科学投资组合

Chinese, Simplified

今天的数据科学就业市场有两件事非常清楚:

  • 对合格的数据科学家有很多需求。 (而且这些工作中的大多数都有可观的薪酬和其他津贴。)
  • 这种需求导致大量求职者申请空缺职位。

假设您的目标是在这个市场中占据入门级位置。您将主要与应届大学毕业生、过渡到数据科学的软件工程师以及数据科学训练营和在线课程的毕业生竞争。



你如何让自己在人群中脱颖而出?



有一个简单但绝非易事的解决方案:建立一个令人印象深刻的投资组合来展示你的技能。



如何开始



确定您的兴趣和目标



您是否有兴趣在特定行业工作,例如银行、零售、信息安全等?您喜欢用数据讲故事和创建引人注目的数据可视化吗?或者您更喜欢构建最先进的机器学习模型?

回答这些问题需要进行一些自我反思,但此过程将帮助您决定要应用您的投资组合构建工作的方向。



研究工作描述



一旦你知道你想专注于数据科学的哪个领域,你可能需要浏览一些该领域的招聘信息。



进行研究并注意以下几点:

 

  • 公司是做什么的?具体来说,公司如何利用数据科学赚钱?
  • 除了您已经知道的技能之外,他们还需要哪些技术技能?您可能需要更加熟悉 Linux 命令行、云技术(如 AWS)甚至 NoSQL 数据库。
  • 数据科学家会为面向客户的产品做出贡献还是为公司内的其他团队构建解决方案?
  • 软技能呢?这个角色是否需要就数据科学的能力和局限性对公司内部或外部的其他人进行教育?

你的投资组合包括什么?



在选择可以帮助您脱颖而出的区域时,有很多选择,例如:

  • 在 GitHub 上创建个人项目
  • 为开源软件做贡献
  • 撰写博客文章
  • 在聚会和会议上发表演讲
  • 通过帮助他人在 Stack Overflow 上建立声誉
  • 通过 Kaggle 平台参加数据科学竞赛



建立投资组合时应遵循的原则

 

无论您想关注哪个投资组合领域,每当您开始集思广益新的项目创意时,都应该牢记一些原则:

  • 完成总比完美好。您可能充满了想法,并尝试同时开始处理多个想法。这可能不是一个好的策略。您冒着将自己分散得太细的风险,并冒着没有精力或动力完成任何特定项目的风险。
  • 质量而不是数量。请记住,目标不是尽可能多地制作您的作品,而是制作一些可以让您受雇的优质作品。
  • 有趣的数据胜过高级分析。避免使用许多“数据科学入门”课程中常见的数据集,因为这些数据集已经过从各个可能的角度进行分析和观察。你不太可能找到任何有趣的东西。相反,尝试在公共数据集存储库中找到“隐藏的宝石”,例如 Google 数据搜索或 AWS 上的开放数据。许多政府都有开放数据门户网站,这些门户网站是有趣数据集的宝库,供有兴趣的人查看。
  • 用数据讲故事。无论您是在撰写博客文章、构建 Web 应用程序还是在观众面前进行现场演示,您的主要角色都是讲故事的人。这意味着你的故事应该 1) 用引人入胜的介绍和有吸引力的数据可视化来吸引人们; 2)为数据集和您的方法提供足够的上下文; 3)教给观众一些他们之前不知道的东西。
  • 通过在社交媒体上分享您的作品来放大您的作品。这可能令人生畏,但如今这几乎是让您的作品向很多人展示的唯一方法。顺便说一句,其中一些人可能是你未来的招聘经理——你永远不知道。
  • 根据反馈进行迭代。根据您从他人那里收到的反馈,对编辑您的作品持开放态度。这不仅会使您的项目变得更好,而且也是您识别和解决知识差距的学习机会。

归根结底,作品集即使不是证明,也是证明您可以完成您在简历中声称的那种工作的证据。 它将为您打开大门,没有它,您将无法触及。

希望到目前为止,您已经很好地了解了如何构建最终会让您被录用的投资组合的过程。

在接下来的文章中,我们将详细说明一些投资组合领域,例如:什么是优秀的博客文章,为开源项目做出贡献时从哪里开始,以及什么是 GitHub 上的优秀个人项目。

原文:https://medium.com/@epicprogrammer/how-to-create-an-outstanding-data-sc…

本文:https://jiagoushi.pro/node/1648

SEO Title
How to Create an Outstanding Data Science Portfolio

【数据科学家】7个你应该做的数据科学项目让你的简历脱颖而出

Chinese, Simplified

数据科学项目将帮助您找到梦想的工作

数据科学现在是一个热门领域,没有比做自己的数据科学项目更好的方式来证明你有资格胜任这份工作。

在这篇博文中,我们将介绍 7 个数据科学项目,您可以利用空闲时间完成这些项目,让您的简历脱颖而出。



1.回归项目



您应该考虑做的第一个项目是基于回归的项目。回归是用于确定两个变量之间关系强度的过程。

换句话说,它可以用来找出一个变量在另一个变量发生变化时变化了多少。这使得回归成为数据科学家非常重要的工具。

要创建回归项目,请选择您感兴趣的数据集并尝试确定不同变量之间的关系。

您可以做的一些回归项目包括:

  • 寻找身高和体重之间的关系。
  • 寻找收入和教育之间的关系。
  • 找出投票行为与年龄之间的关系。
  • 寻找高中生 GPA 和 SAT 成绩之间的关系。

这些项目中的每一个都可以在相对较短的时间内完成,它们将使您很好地了解回归的工作原理。



2.分类项目



您应该考虑做的下一个项目是分类项目。分类项目将帮助您了解如何使用机器学习算法将新数据点分类为一组预定义的类别。

分类对于数据科学家来说很重要,因为它可以用于许多不同的应用,例如图像识别和文档标记。

您应该考虑进行的一些分类项目包括:

  • 将图像分类为不同的类别。例如,您可以使用机器学习算法将动物图片分类为不同的类别(例如,哺乳动物、鸟类、爬行动物等)。
  • 将文本文档分类为不同的类别。例如,您可以使用机器学习算法将《纽约时报》的文章分类为不同的类别(例如,政治、商业、体育等)。
  • 将电子邮件分类为不同的类别。例如,您可以使用机器学习算法将电子邮件分类为“垃圾邮件”或“非垃圾邮件”。
  • 将博客文章分类为不同的类别。例如,您可以使用机器学习算法将来自高流量网站的博客文章分类为“正面”或“负面”。

3.聚类项目



聚类是一种无监督学习算法,它根据数据点的属性将数据点组合在一起。此类项目将帮助您了解如何识别数据集中的集群并使用聚类算法将数据中的项目分组到存储桶或类别中,从而使人类更容易探索大型数据集。

作为数据科学家,Cluster 很重要,因为它用于各种应用,从营销到欺诈检测。

您应该考虑做的一些集群项目包括:

  • 按主题对推文进行聚类。这可用于了解公众对各种主题的看法或跟踪信息在 Twitter 上的传播。
  • 按类型对电影或电视节目进行聚类。例如,您可以对 IMDB 数据集中的流派进行聚类,以发现与您最喜欢的电影类型(例如浪漫喜剧与剧情片)相似但又不完全相同的新电影子流派。
  • 根据产品类型(例如洗衣粉与除臭剂)对杂货店中的物品进行分类。您可以通过根据属性(例如,品牌、尺寸、颜色)对数据集中的项目进行聚类来做到这一点。
  • 将客户分组以进行有针对性的营销活动。例如,您可以根据客户的购买历史或人口统计信息对客户进行聚类。



4. 情绪分析项目



情感分析是识别和量化文本中表达的态度和情感的过程。

作为一名数据科学家,情绪分析很重要,因为它可以用来深入了解客户反馈、产品评论甚至股市趋势。

您应该考虑做的一些情绪分析项目包括:

  • 分析客户反馈数据以识别正面和负面情绪。例如,您可以查看新产品的客户评论并确定最常见的投诉和赞美。
  • 分析 Twitter 数据以了解情绪如何随时间变化。例如,您可以在几周或几个月内跟踪 Twitter 上某个主题(例如总统选举)的情绪。
  • 将电影评论分为正面或负面。例如,您可以使用文本分类算法将来自烂番茄的评论分类为“新鲜”(正面)或“烂”(负面)。
  • 识别关于您的公司及其竞争对手的推文的情绪。例如,您可以跟踪产品的 Yelp 评论并确定情绪如何随时间变化。

5. 推荐系统项目



推荐系统用于对产品和服务进行个性化推荐。

作为一名数据科学家,推荐系统很重要,因为它可以帮助公司个性化他们的营销活动并提高客户参与度。

您应该考虑做的一些推荐系统项目包括:

  • 构建电影推荐系统。例如,您可以构建一个算法,根据用户对以前看过的电影的评分来推荐新电影。
  • 为亚马逊上的产品构建推荐系统。这可以通过使用诸如交替最小二乘 (ALS) 算法之类的算法来完成。
  • 为公司或零售网站构建产品推荐系统。例如,您可以将不同的产品链接在一起以推荐来自同一类别的商品(例如,“如果您喜欢这个产品,那么您也会喜欢这些”)。
  • 构建旅游推荐系统。例如,您可以使用位置数据来推荐用户当前位置附近的活动或餐厅。



6.自然语言处理项目



自然语言处理 (NLP) 是从文本数据中理解和提取信息的过程。

此类项目将帮助您了解 NLP 的基础知识,以及如何从文本数据中提取信息。

作为一名数据科学家,了解 NLP 很重要,因为它可用于分析客户反馈、产品评论甚至法律文件。

您应该考虑做的一些自然语言处理项目包括:

  • 分析客户反馈数据以了解客户如何用自己的话描述产品或服务(例如,反馈是否包含任何正面或负面关键字?)。
  • 从法律文件中提取信息(例如,提取合同的要点)。
  • 从亚马逊上的产品描述中提取信息(例如,提取产品的特征和优势)。
  • 从关于公司或其竞争对手的推文中提取信息。

7. 人工神经网络项目



人工神经网络 (ANN) 是一种类似于大脑的机器学习算法。

它由相互连接的神经元组成,可用于学习和识别数据中的模式。人工神经网络通常用于图像识别或自然语言处理等任务。

有许多不同类型的 ANN,因此您需要选择一种适用于您的特定数据集和用例的。

您应该考虑做的一些人工神经网络项目包括:

  • 构建一个简单的人工神经网络来识别手写数字。
  • 训练人工神经网络来预测股票市场价格。
  • 构建 ANN 将图像分类为不同的类别(例如,狗或猫)。
  • 训练 ANN 来识别文本文档的语言。



今天提升你的简历



谢谢阅读!如果您的简历需要提升,请考虑做这 7 个数据科学项目之一以使其脱颖而出。

从构建人工神经网络或 NLP 算法到分析客户反馈和产品评论以获得洞察力,这些项目可以通过多种方式展示您的数据科学能力。

原文:https://towardsdatascience.com/7-data-science-projects-you-should-do-to…

本文:https://jiagoushi.pro/node/2021

SEO Title
7 Data Science Projects You Should Do to Make Your Resume Stand Out