在Salton,Wong和Yang 提出的传统向量空间模型中,一个词组在文档向量中的权重就是局部参数和全局参数的乘积,这就是著名的tf-idf模型(词频-逆向文档频率)。文档的权重向量d就是 v d = [ w 1 , d , w 2 , d , 。 , w N , d ] T {\displaystyle。
(页面存档备份,存于互联网档案馆)。用户可以下载和使用各种各样的牌组,包括地理、物理、生物、化学和外语(通常根据词频制成)等。 官方网站(页面存档备份,存于互联网档案馆) Anki英文用户手册(页面存档备份,存于互联网档案馆) Anki简体中文用户手册(页面存档备份,存于互联网档案馆)。
╯△╰
( ye mian cun dang bei fen , cun yu hu lian wang dang an guan ) 。 yong hu ke yi xia zai he shi yong ge zhong ge yang de pai zu , bao kuo di li 、 wu li 、 sheng wu 、 hua xue he wai yu ( tong chang gen ju ci pin zhi cheng ) deng 。 guan fang wang zhan ( ye mian cun dang bei fen , cun yu hu lian wang dang an guan ) A n k i ying wen yong hu shou ce ( ye mian cun dang bei fen , cun yu hu lian wang dang an guan ) A n k i jian ti zhong wen yong hu shou ce ( ye mian cun dang bei fen , cun yu hu lian wang dang an guan ) 。
╯0╰
网路上取得的文本分析程式,从复杂的:允许研究人员利用程式处理大量的数据的(如MALLET);和直接的:生成词频列表和文字云,以说明文字的使用状况及其重要性(如TokenX);到基本的:提供对词频与词汇关係的简单视觉化(如wordle)。另外也有一些网站提供对其网站內容的文本分析,如线上网页书签收集与研究工具del。