强烈建议你试试无所不能的chatGPT，快点击我

word2vec 中的数学原理详解

阅读量：6706 次

发布时间：2019-06-25

本文共 807 字，大约阅读时间需要 2 分钟。

word2vec 中的数学原理详解

word2vec 是 Google 于 2013 年开源推出的一个用于获取 word vector 的工具包，它简单、高效，因此引起了很多人的关注。由于 word2vec 的作者 Tomas Mikolov 在两篇相关的论文 [3,4] 中并没有谈及太多算法细节，因而在一定程度上增加了这个工具包的神秘感。一些按捺不住的人于是选择了通过解剖源代码的方式来一窥究竟。

第一次接触 word2vec 是 2013 年的 10 月份，当时读了复旦大学郑骁庆老师发表的论文[7]，其主要工作是将 SENNA 的那套算法（[8]）搬到中文场景。觉得挺有意思，于是做了一个实现（可参见[20]），但苦于其中字向量的训练时间太长，便选择使用 word2vec 来提供字向量，没想到中文分词效果还不错，立马对 word2vec 刮目相看了一把，好奇心也随之增长。

后来，陆陆续续看到了 word2vec 的一些具体应用，而 Tomas Mikolov 团队本身也将其推广到了句子和文档（[6]），因此觉得确实有必要对 word2vec 里的算法原理做个了解，以便对他们的后续研究进行追踪。于是，沉下心来，仔细读了一回代码，算是基本搞明白里面的做法了。第一个感觉就是，“明明是个很简单的浅层结构，为什么会被那么多人沸沸扬扬地说成是 Deep Learning 呢？”

解剖 word2vec 源代码的过程中，除了算法层面的收获，其实编程技巧方面的收获也颇多。既然花了功夫来读代码，还是把理解到的东西整理成文，给有需要的朋友提供点参考吧。

在整理本文的过程中, 和深度学习群的群友@北流浪子（[15,16]）进行了多次有益的讨论，在此表示感谢。另外，也参考了其他人的一些资料，都列在参考文献了，在此对他们的工作也一并表示感谢。

作者：peghoty

出处:

欢迎转载/分享, 但请务必声明文章出处.

你可能感兴趣的文章

MySQL 查看用户授予的权限

JS设置cookie、读取cookie、删除cookie

webpack 通用模块(每个页面都用到的js)编译

python进行数据分析------相关分析

Python数据分析(二): Numpy技巧 (4/4)

菜鸟学Struts——I18N对国际化的支持

LAMP架构介绍MySQL、MariaDB介绍 MySQL安装

Spark读取文件

uiautomator2 使用Python测试 Android应用

mysql建表以及列属性

【转】IT业给世界带来的危机

UWP Composition API - GroupListView（一）

python模块和类的通用转换规则（2），三步转oo

reactive programming

React native 环境搭建遇到问题解决(android)

模式识别hw2-------基于matconvnet，用CNN实现人脸图片性别识别

pandas判断缺失值的办法

如何将svg转换为xaml

在瀚海上的ID

057 Hive项目案例过程

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-28 03:15:50 当前IP: 18.226.166.207 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我