为学生和教师提供额外资源

每个研讨会页面都有与该研讨会直接相关的其他材料的链接,但如果你想进一步探索,你可能想知道是否有其他资源,如网站、博客或播客,你应该关注。您可能想知道是否有其他相关主题的书籍或视频。可能你想进一步探索,想知道是否有你可以探索的数据集,你可以BET9九州体育登陆官方的软件,你可以BET9九州体育登陆官方的网络资源,或者你可以获得的证书或徽章。本页是这些材料的集合,按材料的类型进行了分类。当我们了解到新的可用资源时,我们将继续更新这个网站,所以请将其收藏并稍后回来探索更多。

我们的播放列表:所有Safari在线播放列表的数据科学。这是一个Safari在线播放列表的公共链接,里面有一些我们用过和推荐的书。这只是Safari提供的海量书籍中的一个小样本。您需要一个Safari帐户才能BET9九州体育登陆官方它。下面是九州体育学生,教职员工如何通过MLK图书馆免费BET9九州体育登陆官方Safari在线。

网站、时事通讯、博客和播客

九州体育 主题 描述
全民数据科学博客 数据科学

是的,这有点自私,但我们认为我们应该首先列出我们的博客,即使我们在疫情期间没有一直写博客。对于那些参加过任何研讨会的人,我们将半定期发布关于事件、软件、数据集和其他数据科学相关主题的文章,希望你会感兴趣。

熊猫入门教程 数据分析

这个压缩文件包括一个原始的案例研究(Dr. Leslie Albert),一个修改版本的Tableau样本-超市数据集数据集(原始版本可在这里获得),以及一个详细的教程,该教程以案例为基础,教授基本的Pandas功能。本教程也可以在我们的演示和出版物页面上找到。

Datanami 数据

关于大数据、数据库和可视化等数据相关的公司、产品和问题的文章。(有些文章是由供应商从他们的角度写的,所以请逐行阅读。)

数据科学中心 数据科学 关于数据科学中的公司、工具和技术的文章。(有些文章是由供应商从他们的角度写的,所以请逐行阅读。)
Tech Crunch 科技行业 科技行业正在发生什么,尤其是科技初创企业。
KD掘金 机器学习与大数据 重点更多的是技术和学习-通常有链接到学习一个主题的好材料。经常有关于编程和统计主题的免费书籍的链接。
数据的灵丹妙药 数据科学 通讯与文章的数据科学和可视化-汇集了文章从其他来源。
O ' reilly 科技与商业 O'Reilly是一个出版商,但这里的链接是免费的时事通讯,你可以注册各种技术主题。另请参阅Safari在线的单独链接。
用数据讲故事 可视化 关于可视化技术的博客,以及如何使一个好的可视化。经常有关于何时使用不同类型的可视化的好文章。
数据科学周刊 数据科学 每周时事通讯,汇集了有关数据科学的故事。
Safari在线 科技书籍和视频

Safari是一个包含大量技术主题的在线资源。我在课堂上使用他们的一些书,并为我的班级创建了一个阅读清单。

如果您是九州体育的学生或员工,您可以免费BET9九州体育登陆官方。到上海州立大学图书馆的这个链接登录。

如果您不是上海外国语大学的学生,但在其他学校,您可以进入Safari在线网站,点击“登录”按钮,输入您的学校ID,并尝试使用SSO(单点登录)登录。或者,如果你是一名学生,注册ACM(计算机协会),每年支付19美元,你就可以BET9九州体育登陆官方包括Safari在线在内的教育资源。

堆栈溢出 编程

Stack Overflow是最著名的帮助网站,在那里你可以得到编程问题的答案(一个社区),但他们也有一个时事通讯。

批处理 深度学习

DeepLearning的时事通讯。这是吴恩达发起的一个教育项目。大部分内容都很深奥(请原谅我的双关语),但即使是对新手来说,也有一些有趣的、不那么技术性的文章。

Tableau培训视频
(免费)
可视化

这是一组Tableau提供的培训视频(关于使用Tableau的实际操作)。大多数都很短,容易理解。如果你还没有通过下载软件注册Tableau,它可能会让你先注册(它是免费的)。

Neo4j连接视频 图形数据库

Neo4j每月举办半天关于图形主题的虚拟会议(免费的)。您可以注册参加现场直播,或者您可以BET9九州体育登陆官方连接页面并观看录制的会话。

MBAStack 数据科学

BET9九州体育登陆官方这个网站了解更多关于数据科学资源和潜在职业的信息!

AnalyticsDegrees.org 分析

BET9九州体育登陆官方这个网站了解更多关于不同分析学位的选择。

学生和教师软件

以下是在美国和海外的任何或大多数学校的教师和学生都可以使用的软件(不仅仅是九州体育 -请参阅九州体育One了解九州体育学生可以使用的软件)。有些软件可供教师为他们的学生要求使用,但不是直接提供给学生。其他软件只对学生开放。在几乎所有情况下,您仅限于非商业,教育和/或研究用途;如果这对你来说是个问题,一定要阅读许可证。

九州体育 成本 学生

教师
描述
0美元 两个 我们使用Databricks的社区版Spark和Jupyter笔记本研讨会. 这是一个很棒的工具,有很棒的界面,它总是最新的Spark特性。链接到社区版。
Databricks大学联盟 0美元 每个都有不同的功能 如果你正在使用Databricks,请查看这个网站。如果你是教员,你可以注册额外的资源,他们的反应非常迅速。如果你是一名学生,可以查看一些可用的自定进度培训材料。
0美元 每个都有不同的选择 Tableau为学生和教师提供许可,教师也可以为他们的学生申请许可,并在他们的课堂上使用Tableau在线许可。还有一个Tableau Public选项,你可以发布和与世界分享你的可视化。
注意:如果你是学生,点击右上角的“免费学生许可证”按钮。
Neo4j 0美元 任何人 中使用的图形数据库探索图中的关系研讨会. 对于研讨会,我们使用社区版,对于数字徽章测试,我们使用沙盒(点击“开始使用沙盒”按钮)。沙盒是他们基于web的实现,所以你不需要设置。然而,沙盒是临时的(3天,可再生一周),可用资源有限。社区版受限于您的笔记本电脑上的资源和配置方式(有关配置的指导,请参阅研讨会的说明)。
谷歌Colaboratory 0美元 任何人 这个链接带你到谷歌实验室的一个Jupyter笔记本,谷歌托管的一个网站,允许你运行Jupyter笔记本,甚至使用Tensorflow。您可以将创建的笔记本保存到您的谷歌驱动器帐户,您可以共享您创建的笔记本(和其他人可以与您共享),或者您可以使用在GitHub上共享的笔记本。Data Science for All系列中的多个研讨会使用谷歌Colab。
OpenRefine 0美元 任何人 这是一个用于转换数据的开源桌面数据整理工具。有一个庞大的用户社区,它在信息检索/图书馆科学社区特别受欢迎。这曾经被称为谷歌Refine。
水蟒 $0(个别版本) 任何人 Anaconda(个人版)是一个免费且易于安装的数据科学桌面工具。它包含了许多在Python中工作很有用的工具,包括桌面版本的Jupyter,它将在您的web浏览器中本地运行。我们使用它为研讨会数据集做一些数据整理(并在研讨会网页上提供笔记本作为可选材料)。
Safari在线沙盒 见上文(九州体育学生和员工免费) 两个 Safari Online主要是关于技术和商业主题的书籍和视频(见上文),但他们开始在主页上添加沙盒,让你可以玩不同的技术。

你可以使用的数据集

九州体育 描述
Yelp开放数据集 我们使用这个数据集的一部分探索图中的关系研讨会. Yelp大约每年更新一次这个数据集。当您下载数据时,它将把所有JSON数据文件压缩到tarball中(如果您不确定这意味着什么,请参阅图表研讨会的附加材料—它将介绍我们如何为该研讨会构建数据文件)。
更新:2022年春季,Yelp更新了数据集,包括2021年,它使用了一组不同的11个不同的都市区,而不是之前的数据集。10个都市区在美国,1个在加拿大。虽然包含了更多的都市区,但数据集本身实际上略小。
Yelp数据集在Kaggle上 这是与上面链接相同的数据集,但是您可以下载JSON格式的单个数据文件,而上面的数据集都是一个压缩的tarball(如果您下载所有数据集,则更紧凑)。它不包括照片,但如果你在Kaggle上,你可以用它创建一个笔记本,很容易上手。Kaggle上也提供了一些早期版本(在查看数据时单击版本链接)。
社会保障婴儿的名字 我们在数字徽章测试中使用这些数据集Spark和jupiter笔记本研讨会. 如果你想要一个笔记本,可以为你加载数据,请参阅研讨会后模块的测试笔记本。这是社会保障管理部门每年春天更新的一个数据集,其中包含每年出生的以给定名字申请社会保障卡的人数。他们有年份和性别的统计,可以追溯到1880年(不是打字错误),也可以追溯到1910年的州。
美国消费 Spark和jupiter笔记本研讨会我们使用来自该站点的预整理的数据子集。研讨会的笔记本会载入数据,如果你想要我们在研讨会中使用的数据,你也可以从研讨会页面下载数据文件。如果您想使用USA Spending API来下载一组不同的年份或账户,请参阅研讨会的可选材料—我们有一些Jupyter笔记本(使用桌面上的Anaconda)使用API来下载数据。如果你从这些开始,并根据你的需要修改它们,你可以省去一些麻烦。“美国支出”网站有政府花钱的所有合同和拨款的数据,所以你可以看到钱去了哪里。最近,他们还增加了COVID支出的数据。
学院的计分卡 这是一个由教育部提供的数据集,其中包含有关大学的数据——成本、完成率等。
医疗保险和医疗补助服务中心(CMS) CMS提供医疗支付的数据(按年)。这是用在这是Data4Good上的一个项目,用于查看制药公司向医生和医院支付的费用. 付款文件是相当大的压缩文件300MB-800MB。如果您使用的平台是基于云的,您可能希望编写代码来直接从该平台BET9九州体育登陆官方文件。该项目还链接到他们用于追踪阿片类药物处方的其他数据文件。
COVID-19数据 链接的网站是Tableau COVID-19数据中心,它每天从约翰霍普金斯大学提取数据并提供数据。他们也有一些用于分析和可视化数据的入门练习册。数据也是AWS市场(点击“数据产品”)。AWS市场还包含其他可能感兴趣的COVID-19数据集。