终身学习者、大学教师。稍微懂一点儿写作、演讲、Python和机器学习。公众号“玉树芝兰”(nkwangshuyi)。
本文为你介绍,如何从 Waze 交通事件开放数据中,利用序列模型找到规律,进行分类预测。以便相关部门可以未雨绸缪,提前有效干预可能发生的严重拥堵。
硬件平台、软件环境和算法模型的一站式支持,可以让各学科的研究都能从数据科学的发展获益。 开放 今天是北得克萨斯大学(University of North Texas, UNT)科研信息技术服务中心(Research IT Services)的开放日(Open House)。
这一份视频教程中,我会用简明的例子和手绘图,为你讲解循环神经网络(Recurrent Neural Network, RNN)的原理和使用方法。
本文带你认识一个优秀的新深度学习框架,了解深度学习中最重要的3件事。 框架 看到这个题目,你可能会疑惑: 老师,你不是讲过如何用深度学习做图像分类了吗?迁移学习好像也讲过了啊! 说得对!我要感谢你对我专栏的持续关注。
本文通过一个命令行转换 pdf 为词云的例子,给你讲讲 Python 软件包安装遇挫折时,怎么处理才更高效? 遭遇 前两天,有位读者留言求助。
用好 R 环境下的 BiblioShiny 软件包 ,可以让你在友好的图形化界面,快速扫描科研领域。 场景 作为一个初学者,你可能很希望快速了解一个新的科研领域。
据说技术门槛在降低。作为文科生的你,该如何从这种趋势中收获更多? 苦恼 你大概经常听别人提起,技术的门槛在降低。 数据科学、机器学习、自然语言处理、神经网络、人工智能……一系列的名词让你眼花缭乱,让你对这个时代充满兴奋的感觉。
需求 有个朋友提出,希望把目录中的许多 markdown 文件,批量转换为对应名称的 pdf 格式文件。我于是编写了一个 Python 脚本,并且分享给你。
多问自己一个“那又怎样?”,会很有用。 疑问 7月初,我赴南京参会。 James Hendler 教授的演讲非常精彩。 其中一个片段,让我印象深刻。
之前给你写的科研入门系列文章,一不留神,居然都攒成了本书。 链接 咱们开门见山。 我把之前公众号和专栏发布的关于毕业论文写作全过程(包含选题、文献阅读、文献分析、论文写作和答辩注意事项等)内容,集结成了一本书,并且在线发布了。
Overloaded This afternoon, I trained a 3-layers neural network as a regression model to predict the house price in Boston district with Python and Keras.
将事情缩减至其根本实质。 实质 “第一性原理”这个词儿被吹得神乎其神,似乎是威力无穷。 大家都知道了伊龙马斯克(Elon Musk)把这个原理用得好,可以把火箭发射成本降低到原先的几十甚至上百分之一。
如果一幅图胜过千言万语,那么一幅会动的图呢? 需求 绘制统计图形,是为了给谁看? 显然不是给电脑看。 因为它看不懂,也没必要看。给它数据就好了。
用最简单的方式,完成探索性分析。 痛点 实践中,大量数据分析时间,都会花在数据清洗与探索性数据分析(Exploratory Data Analysis, EDA)。
分不清谭卓和郝蕾?各来200张照片,让深度学习帮我们识别吧。 问题 《如何用Python和深度神经网络识别图像?》一文中,我给你展示了如何用深度学习,教电脑区分机器人瓦力和哆啦a梦。
本文为你介绍,如何在 GPU 深度学习云服务里,上传和使用自己的数据集。 疑问 《如何用云端 GPU 为你的 Python 深度学习加速?》一文里,我为你介绍了深度学习环境服务 FloydHub 。
负荷 下午,我用 Python 深度学习框架 Keras 训练了一个包含3层神经网络的回归模型,预测波士顿地区房价。 这是来自于 “Deep Learning with Python” 书上的一个例子。
好的模型,为什么非得是人能够理解的? 有的人,对深度学习(deep learning)模型,很不以为然。 说根本没有搞清楚因果关系,只是拿出相关性来说事儿。
利用 Python 和 Spacy 尝试过英文的词嵌入模型后,你是不是很想了解如何对中文词语做向量表达,让机器建模时捕捉更多语义信息呢?这份视频教程,会手把手教你操作。
咱们以《三国演义》人名和兵器谱为例,尝试读取不同结构的文本文件,并且对其中的信息进行统计分析和可视化。 入门 如何帮助学生高效入门 Python ,一直是困扰我的问题。
咱们的 Python 教程代码已经可以免安装在线运行了。但如果你希望在本地克隆运行环境,请参考本文的步骤说明。 疑惑 这些日子,我用课余时间,忙着把自己知识星球的分享文章转移到语雀平台,以便于订阅用户阅读和获得即时推送。
若要独立用 Python 处理数据科学问题,Pandas 是绕不过去的。 新番 今天,花了一上午的时间,跟着这个 Youtube 系列教程,学习了 Pandas 中级技巧。
其实,不只是iPad,手机也可以。 痛点 我组织过几次线下编程工作坊,带着同学们用Python处理数据科学问题。 其中最让人头疼的,就是运行环境的安装。
本文教你用简单易学的工业级Python自然语言处理软件包Spacy,对自然语言文本做词性分析、命名实体识别、依赖关系刻画,以及词嵌入向量的计算和可视化。 盲维 我总爱重复一句芒格爱说的话: To the one with a hammer, everything looks like a nail. (手中有锤,看什么都像钉) 这句话是什么意思呢? 就是你不能只掌握数量很少的方法、工具。
不愿意看那一堆公式符号,却想知道卷积神经网络(Convolutional Neural Network)如何做图像分辨?分享一段我给自己研究生的讲解答疑视频,希望对你有帮助。
毕业前,着力打造三种核心能力,让你在人群中脱颖而出,远离被人工智能淘汰的担忧和烦恼。 精彩 放假前的周末,在为公众创,教师、学生、企业家和社会公益人士们围坐,看视频。
image 关于毕业论文写作,我大概也只能帮你到这儿了。 需求 不少高年级本科生,在面对毕业论文写作的时候,颇有一种未经训练,即被推上战场的感觉。
如果你不想学编程,数据采集爬虫也是可以用的。 简介 最近的一次组会,我们请来了一位分享嘉宾——15级研究生庞琳同学,给我们科研团队分享网站评论数据的采集。
好的答辩幻灯,是你的重要产品。你要锁定客户,理解痛点,并且有效传递信号。 痛苦 毕业论文季,许多同学都会很痛苦。 好不容易做完了毕业论文,还得做幻灯,准备答辩。
最近我试用了一段时间的幕布,用户体验很好。 image 虽然本人用workflowy, dynalist和幕布等独立大纲应用时间不长,但是使用 Emacs + org-mode 超过 10 年,对这种列表大纲式应用并不陌生。
image 写给研究初学者的论文阅读简明教程。 痛苦 做研究,少不得要读论文。 如果你不了解一个领域已经被研究成了什么样子,又如何找到自己研究的切入点呢? 可是,对许多初学者来说,读论文是件痛苦的事儿。
本文为你展示,如何用Python把许多PDF文件的文本内容批量提取出来,并且整理存储到数据框中,以便于后续的数据分析。 问题 最近,读者们在后台的留言,愈发五花八门了。
利用Python机器学习框架scikit-learn,我们自己做一个分类模型,对中文评论信息做情感分析。其中还会介绍中文停用词的处理方法。 疑惑 前些日子,我在微信后台收到了一则读者的留言。
你期待已久的Python网络数据爬虫教程来了。本文为你演示如何从网页里找到感兴趣的链接和说明文字,抓取并存储到Excel。 需求 我在公众号后台,经常可以收到读者的留言。
链接散落的教程文章,做个详细的导读,助你更高效入门数据科学。 问题 2017年6月以来,我陆续在自己的简书专栏《玉树芝兰》里,写了一系列数据科学教程。
只需要花10几分钟,跟着教程完整做一遍,你就能自己用Python做出词云了。 《如何用Python做词云?》图文版发布于2017年6月,是我数据科学系列教程中的第一篇。
本视频教程针对Windows 7平台,集成3.6版本Python的Anaconda录制。 根据我多次线下编程工作坊获得的反馈经验,发现Python初学者居然在环境安装步骤,就很可能遭受挫折。
罗胖说他找到了“最长跑道”。你以为他说的是卖书?还是卖课?其实,他已经换了跑道,要开始“卖人”了。 跑道 丁酉年的最后一场得到例会,罗胖发烧了。
传统的关键词检索论文,浩如烟海的结果让你无所适从?试试人工智能检索引擎。根据你的研究兴趣和偏好,便捷而靠谱帮你找论文。 image 烦恼 进入一个新领域,读论文是必然途径。
手里明明有一份学生成绩Excel表格,却还得一一手动把它们输入到教务系统?类似这样的简单重复枯燥操作,其实你都可以一键让电脑自动替你完成。 痛点 期末了,学生们考完试,都愉愉快快放假回家了。
给你10万张图片,让你找出与其中某张图片最为近似的10张,你会怎么做?不要轻言放弃,也不用一张张浏览。使用Python,你也可以轻松搞定这个任务。
用VOSviewer尝试CNKI中文文献关键词共现(keyword co-occurence)分析时,你可能会踩到一个大坑。本文帮助你绕开这个坑,或是从坑里爬出来。
只需要10几行Python代码,你就能构建自己的机器视觉模型,快速准确识别海量图片。快来试试吧! 视觉 进化的作用,让人类对图像的处理非常高效。
本文一步步为你介绍,如何用Python自动判断多张图片中哪些超出阈值需要压缩,且保持宽高比。如果你想了解Python图像处理的基础知识,欢迎动手来尝试。 痛点 我喜欢用Markdown写文稿,然后发布到不同写作平台。
记住几个关键词,可能对你开启职场生涯有些帮助——负责,尊重,不要计较。 你马上就要毕业走上职场了,这是一件让人欣喜的事情。 但是目前的情况,让我看到了一丝隐忧。
当你开始接触丰富多彩的开放数据集时,CSV、JSON和XML等格式名词就会奔涌而来。如何用Python高效地读取它们,为后续的整理和分析做准备呢?本文为你一步步展示过程,你自己也可以动手实践。
本文一步步为你演示,如何用Python从中文文本中提取关键词。如果你需要对长文“观其大略”,不妨尝试一下。 2017-12-07-20-38-22-7-426487.png 需求 好友最近对自然语言处理感兴趣,因为他打算利用自动化方法从长文本里提取关键词,来确定主题。
本文用简明的样例,介绍如何使用Markdown和自动化工具帮你处理数学公式、参考文献引用、图片交叉索引等学术论文写作中常见的棘手问题。快来试试吧。 image 苦恼 自从我学会了如何在数字文档上用红笔写写画画,跟学生合写文章和指导毕业论文的工作就变得轻松多了。
看似无边无际、高深难懂而又时刻更新的数据科学知识,该怎样学才更高效呢?希望读过本文后,你能获得一些帮助。 疑惑 周五下午,我给自己的研究生开组会。
Python深度学习简明实战教程来了。别犹豫了,赶紧从零开始,搭建你自己的第一个深度学习模型吧! 想不想了解如何用Python快速搭建深度神经网络,完成数据分类任务?本文一步步为你展示这一过程,让你初步领略深度学习模型的强大和易用。