图解数据科学,文本分析、知识图谱详解,实战案例呈现,助你深入理解技术原理,行业应用启发,助力创新发展。
本书内容
数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的实现路线,并对应用于业界算法大赛中的技术方案和技巧进行源代码解读,帮助读者深入理解技术原理。最后,本书还介绍了文本分析和知识图谱技术在政务、公共安全、应急等多个行业中的智能应用实践案例。
本书作者
苏海波
清华大学电子工程系博士,副研究员,在文本分析、知识图谱、大模型等人工智能方向拥有超过十年的研发实践经验。多篇SCI和EI论文发表于国外顶尖学术会议和期刊,获得国家发明专利20余项,曾担任科技部重点研发计划子课题负责人。获得2019年和2020年北京市科学技术进步奖,带领团队获得多个业界知名算法技术评测的冠军和亚军。
刘译璟
北京大学博士、正高级工程师,现任北京百分点科技集团股份有限公司CTO。在云计算、大数据、人工智能等领域拥有15年研究和工作经验。曾荣获北京市科学技术奖等奖项,承担国家科技部重点研发计划项目2项,参与多个国家自然科学基金项目,多篇论文曾发表于国内外学术刊物。
易显维
中国地质大学硕士,拥有12年AI算法研发岗相关研发管理经验。在数据挖掘、OCR、文本分析等方面拥有丰富的实践经验,在众多知名企事业单位举办的高水平机器学习算法竞赛中累计获奖20余次。
苏 萌
美国康奈尔大学博士,研究员, 现任北京百分点科技集团股份有限公司董事长兼CEO、北京大学国家发展研究院实践教授、北京大学光华管理学院实践教授、北京市商会副会长、海淀区工商联副主席、海淀区政协委员、国务院学位委员会全国应用统计专业 “大数据专家委员会" 委员等。曾执教于北京大学光华管理学院,任副系主任、博士生导师。
本书读者
《数据科学技术:文本分析和知识图谱》适合具备Python和机器学习技术基础的高等院校学生、文本分析(或者自然语言处理)以及知识图谱领域的算法工程师和研究机构的研究者阅读,也适合数据科学和人工智能领域的研究者作为参考书。
编辑推荐
《数据科学技术:文本分析和知识图谱》是一本深入浅出的数据科学技术指南。书中详细介绍了文本分析和知识图谱等关键技术,结合典型案例展示了数据科学在安全、应急等行业的应用实践。无论你是数据科学领域的专业人士还是对数据科学感兴趣的读者,这本书都能帮助你深入了解数据科学的基本概念、方法和最新技术。通过学习《数据科学技术:文本分析和知识图谱》,你将能够掌握数据科学的核心知识,为自己的职业发展和创新项目提供有力支持。
本文节选自《数据科学技术:文本分析和知识图谱》,内容发布获得作者和出版社授权。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。