1. 营销策划师首页
  2. 产品文案策划

自然语言处理0如何定义“入门”?能掌握NLP的基本算法

自然语言处理0如何定义“入门”?能掌握NLP的基本算法自然语言处理应用场景与发展前景自然语言处理技术便是让计算机拥有理解和生成人类语言的能力,自然语言处理常见的应用场景包括:机器翻译、文本摘要、问答系统、对话系统、语音识别、阅读理解、看图说话等等。随着技术的进步以及硬件算力的提升,自然语言处理技术必将更快的渗透到生活的各个角落。深度自然语言处理课程在课程之外,还推荐一本宗成庆的《统计自然语言处理》

0 如何定义“入门”?

能掌握NLP的基本算法能阅读并复现一些经典的论文,并养成读论文的习惯有一定的(最好是基于企业生产实践的)项目经历,比如实现一个对话系统

1 自然语言处理应用场景与发展前景

自然语言处理技术便是让计算机拥有理解和生成人类语言的能力,自然语言处理常见的应用场景包括:机器翻译、文本摘要、问答系统、对话系统、语音识别、阅读理解、看图说话等等。随着技术的进步以及硬件算力的提升,自然语言处理技术必将更快的渗透到生活的各个角落。

在发展前景方面,2017年7月,国务院印发了《新一代人工智能发展规划》

《规划》中指明了未来数十年内都将坚定不移地推进人工智能技术的发展与应用,加大人工智能研究投入,扩大人工智能产业规模。

这一切的总体规划,都是建立在培养大量的人工智能人才的基础上的,因此人工智能领域有极大的人才缺口,AI+大数据方向的工作待遇十分优厚。

随便找一个招聘网站,搜索NLP工程师/自然语言处理,都能发现大把的岗位空缺,待遇也基本都在一年20W以上,整个招聘市场呈现出极大的供不应求的态势,因此此时学习NLP、把握住时代红利,是非常明智的选择。

2 机器学习/深度学习理论基础+代码基础

对于大多数人来说,看书是较为枯燥晦涩的,,最推荐的是线下课程,其次是线上视频或者看书等等方式,对于想要快速入门的小伙伴我强烈推荐:

贪心学院AI就业班

官网链接:

AI就业班的整个课程的学习阶段分为三部分:

首先是Python基础与数据分析:学习Python的基本语法、Numpy、Matplotlib、Pandas等库、Scrapy、requests等爬虫工具、pyecharts进行数据展示、并学习数据分析报告的撰写;

然后是机器学习基础:学习统计学和线性代数基础、KNN、梯度下降、线性回归、逻辑回顾、决策树、随机森林、GBDT、K-means、SVM等等算法,并进行项目实践,完成机器学习入门过程;

最后是自然语言处理技术:由浅入深地学习文本处理、数据清洗、文本表示、词向量、RNN/LSTM模型、Seq2seq、Auto-attention、Transformer、Bert、关系抽取、模型压缩和图神经网络等方面的内容,并通过项目实践,将你培养成为一名真正的NLP工程师。

整个课程由浅入深、每一部分都对应着相当完善、难度适中、贴近现实的案例项目,每一个项目都能作为将来升学或者求职简历上的一个加分亮点。而且随时有强大的导师团队手把手教学,耐心细致地答疑解惑,能够迅速提升你的整体能力。

相比于看书和网课,AI就业班的优势还在于线下教学,全程线下进行实训,拉近同学和老师之间的距离,老师能够更细致地手把手进行指导,也更方便老师为同学们答疑解惑。在完成了所有的学习与实践之后,还能接触到实地的企业项目,让你在真实的工作岗位中学习,极大提升你的求职竞争力。

吴恩达机器学习

无需多言,被无数人推荐的入门经典:

有条件的小伙伴也可以直接上Coursera配合随堂测试和课后练习一起来做:

吴恩达CS229

这是吴恩达教授在斯坦福大学开设的的机器学习课程,整体内容和Coursera上吴恩达的机器学习课程内容相近,但这项课程对机器学习的数学原理讲解更加深入,想要长期从事机器学习/深度学习相关方向研究的同学,认真跟完这门课应该会受益良多。

李宏毅机器学习

台大李宏毅教授的机器学习课程 ,这门课程内容十分丰富,包括了从机器学习到CV到NLP在内的诸多内容,李宏毅教授本人也风趣幽默,讲解案例深入浅出,非常能调动同学们的学习兴趣,而且因为整个课程内容涵盖丰富,对于时间有限的同学可以只选取其中的一部分进行学习,下方给出了这门课的学习路线图,对于NLP有兴趣的同学可以优先学习从RNN到Seq2seq这条路线。

李宏毅的个人主页

~tlkagk/

在个人主页里面可以找到李宏毅教授开设的所有课程,和相应的PPT/示例代码等等

在视频教程之外,对于踏实有耐心的小伙伴也非常推荐读书,在此推荐几本入门深度学习的经典书目:

首先是周志华的《机器学习》,简称西瓜书,这本书深入浅出,把复杂的数学推导过程用清晰简洁的图片和语言表示出来,非常适合新手入门,但缺点是对于想要深入了解底层数学推导过程的同学而言,这本书有点过于简洁。

为了解决西瓜书过于简洁的问题,配套西瓜书的还有南瓜书《机器学习公式详解》,这本书和西瓜书章章对应,对西瓜书中的数学概念作了非常多非常详尽的补充,建议二者配合食用。

自然离乳不涨奶还需要处理吗_在家怎么处理自然蜂蜜_自然语言处理

然后是Ian Goodfellow的《深度学习》,又称花书,相较于西瓜书而言较为深入也较为晦涩,耐住性子,认真读下来,能够帮助你快速构建深度学习方面的知识体系。

此外还有李航的《统计学习方法》,此书包含大量的数学推导,但都较为详尽严谨,非常详实,有手把手带你推公式的感觉,可以和西瓜书配合食用,西瓜书中被简化和跳过的推导过程在这本书里往往都能找到,这本书也可以当作工具书来查询,平时放到案头,以解数学功底不足时的燃眉之急。

代码基础

​ 机器学习主要使用Python语言,Python语言本身语法简洁优美,有其他语言基础的同学可以直接很快上手,不必单独学习Python,直接跟随吴恩达/李宏毅的课程进行练习即可。

​ 对于没有代码基础的,也不建议直接对着书一遍一遍敲基础语法,更推荐直接跟着课程或者直接跟着项目走

​ 这里比较推荐贪心科技的AI就业班:NLP人工智能工程师培养计划,其中的Python教程部分面向实际,使用较短的篇幅对基础语法进行讲解之后便直接进行常用库的学习,如Numpy、Pandas、pyecharts等等,随后便开始进行项目,节奏紧凑,内容丰富。

而且这套课程对于非科班的学生也非常友好,以我为例,我在本科学习的是金属材料,只写过一些MATLAB的基础代码,并没有经过系统的编程思维以及编程方法训练,在上课之前对于Python一无所知,但在跟随贪心学院的老师经过一段时间的学习后,我能较为轻松地使用Python来解决一些常见的问题,并且对python各种官方和第三方库的使用有了较为熟练的掌握。

整套课程以项目为导向自然语言处理,学员们从真实有趣的项目中获得提升:包括公司数据爬虫、新冠疫情数据分析、知乎爬取与数据分析等等项目。在完成Python基础与数据分析这部分课程内容之后,经过了上述各个项目的历练,我具备了基本的数据分析能力,能够独立分析问题,爬取数据、分析数据并撰写数据分析报告,数据分析能力得到了大幅提升,对于我的职业发展也大有裨益。

课程链接:

​ 经过数个项目训练之后,我的代码能力便会得到了全方位的提升,扫清了代码能力上的障碍后,便可以对NLP知识进行系统地学习与实践。

3 NLP基础知识

首先从文本的清洗处理开始,学习词向量、反向传播推导、依存分析、RNN、LSTM、文本生成、Self-Attention、Transformer、再到理解BERT(就如CV中的Resnet backbone一样泛用的存在),最后再到关系抽取与模型压缩、提升性能与优化部署等等

学习NLP,推荐一个斯坦福大学的教程:

CS224n 深度自然语言处理课程

课程时长不是太长,但理论推导非常完备,涉及到了NLP学习中的许多关键问题,适合有一些深度学习基础和代码基础的同学入门NLP。

在课程之外,还推荐一本宗成庆的《统计自然语言处理

自然语言处理_自然离乳不涨奶还需要处理吗_在家怎么处理自然蜂蜜

这本书涵盖面广,并且涉及了一些语言学和语音学的知识,对于NLP的数学基础部分讲解地也较为简明,即使不推公式,也可以将这本书当作一本入门NLP的指导性读物来进行泛读。

如果感觉听课或者看书比较吃力的话,也可以直接加入贪心科技的AI就业班:

贪心学院的AI就业班课程在自然语言处理技术这部分内容中包含了词向量、RNN/LSTM模型、Seq2seq、Auto-attention、Transformer、Bert、关系抽取、模型压缩和图神经网络等方面的内容,全面且细致,将我从机器学习的小白领入了门,并且系统地对NLP知识有了掌握,做到了能够阅读前沿论文、掌握先进学术动态的程度。

贪心学院的课程设置也非常合理,由浅入深,课程中包含了NLP技术入门所需的所有方面,并且跟随课程还有大量的项目可以进行练习,避免了听课做题的枯燥无味,在项目实践中提升自己的代码能力和工程能力。

在NLP技术的基础知识学习完成后,便开始项目实践,在这部分内容中,我们实践搭建了一个智能客服问答系统,使用检索式框架,结合倒排表、搜索、召回、排序、相似度匹配等等操作,并基于BERT表示模型,搭建了智能客服问答系统。这个项目难度适中,并且涉及到很多NLP基础知识,非常适合作为进阶的第一个项目。

随后我们又进行了智能营销文案生成和基于闲聊的对话系统搭建这两个项目,在项目进行的过程中,运用到了之前学习的Seq2seq、Beam search、多模态和Transformer等等诸多内容,是理论与实践的一次完美结合,极大地提升了我的动手能力,也加深了我对自然语言处理的认识。

4 项目导向:在实践中学习

不论是学习Python、学习机器学习理论还是学习NLP的种种算法,单纯地听课做题是远远不够的,最有效、最快速的方法便是跟随一个个项目来进行实践。

大家当然可以自己在网络上寻找合适的项目来进行练习,但网络上项目众多,难辨其良莠,对于新手也很难找到难度匹配、适合自己的项目,而若碰到老旧、维护较少的项目,出现的问题也难以与人讨论,难以得到有效的指教。因此有人带、有人指点、有一套成熟完整的项目体系便显得尤为重要

这时候就又要安利一下贪心学院的AI就业班:

贪心学院有着实力雄厚的导师团队,教研团队成员由亚马逊、谷歌、微软高级工程师构成,拥有极强的理论基础和商业实战经验:

李文哲 :教研负责人,曾任美国亚马逊和高盛的高级工程师,是金融行业开创知识图谱做大数据反欺诈的第一人。 先后在AAAI、KDD、AISTATS、CHI等国际顶级会议上发表过15篇以上论文。

蓝振忠:现任Google科学家,曾任美国智能监控公司的首席科学家, 对视频和多媒体的智能分析有深入研究。美国卡耐基梅隆大学博士、先后在NIPS、CVPR、ICCV、IJCAI、ICDM等国际顶级会议上发表过25篇以上的论文,论文引用次数上千。

袁源:美国微软总部和美国亚马逊总部的资深推荐系统工程师,人工智能、分布式系统、云计算方面的专家。 美国新泽西理工博士,拥有14年人工智能、推荐系统、自然语言处理、数字图像和视频处理项目经验。曾师从中国科学院王守觉院士从事人脸识别研究。

史源:拥有10多年人工智能领域相关研发和研究经历,负责过美国政府多项人工智能基金项目。美国南加州大学人工智能博士,卡耐基梅隆大学机器人系访问学者,先后在 ICML、AAAI、IJCAI、ICDM等国际会议上发表数篇论文,引用次数高达1000。

贪心学院的老师都和蔼可亲、认真细致,在我学习的过程中悉心指导,而且有着极高的专业素养和严谨的教学风格,能得到这样优秀团队的指点,是我迅速成长为一个合格NLP工程师的重要因素。

此外,在完成了所有的学习与实践之后,我还接触到了实地的企业项目,在完成为时三个月的课程学习阶段后,贪心学院根据学员的个人意向和特长,将学员推荐到相应企业、相应岗位中去自然语言处理,进行为时两个月的企业项目组体验,各个企业项目组涵盖了NLP的各个方向,包括对话系统、舆情监测、智能写作等等,学员接触到生产一线的问题和方法、将所学的内容用于实践,全方位提升自身的深度学习实战能力。

​ 最后,能与贪心学院中各位优秀的同学和老师为伍,是我莫大的荣幸,在提升能力之余,我接触到的企业专家、AI教师以及共同成长的同学,都成为了我的人脉,成为了我未来人生中的一笔宝贵财富。

发表评论

邮箱地址不会被公开。 必填项已用*标注

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息