各种专业资料汇总

链接失效,请@我

中文分词文献列表

条件随机场文献列表

深度学习资料列表1

深度学习资料列表2

深度学习资料列表3 [Read More…]

发表在 机器学习 | 留下评论

机器学习书单

入门:

机器学习导论

机器学习 周志华

书评

统计学习方法 李航

Pattern Recognition And Machine Learning

书评

Machine Learning : A Probabilistic Perspective

The Elemen [Read More…]

发表在 机器学习 | 留下评论

Topic Model 资料

1. 开山之作:

Latent Dirichlet Allocation

David Blei's introduction on topic models

2.   LDA 初探

Finding scientific topics

Developed collapsed Gib [Read More…]

发表在 数据挖掘, 机器学习 | 标签为 | 留下评论

MPI 消息机制

看了前面的文章,应该对MPI有了大概的了解,下面来看看MPI的消息机制。

消息是什么,消息是message,是information,是news,是一封信。消息内容相当于信本身(数据),消息的接收者相当于信封上的内容(信封)。因此通常将前者称为消息的buffer, 后者称为消息的envelop。 [Read More…]

发表在 程序园 | 标签为 | 留下评论

MPI—"Hello World"

1. MPI的安装与配置

单机器环境下:

Ubuntu

安装很简单,下载 openmpi 安装包;

tar xvf openmpi-1.10.2.tar.gz

mv openmpi-1.10.2 openmpi

cd openmpi

./configure

make [Read More…]

发表在 程序园 | 标签为 | 留下评论

自动问答系统

自动问答系统

1. 自动问答系统

什么是自动问答系统(Question and Answering)呢,一般将其定义为一个能回答任意自语言形式问题的自动机。其输入为自然语言形式的问题,输出应该是一个简洁的答案,而不是一堆相关的文档列表。 比如,“世界上第一台计算机什么时候发明的”,自动问答系统应该能够给 [Read More…]

发表在 未分类 | 留下评论

Mac 下配置Latex

一直在windows 下使用Latex撰写各种文档,最近转换Mac阵营,费了一番功夫,终于搞定Mac下的Latex。顺便说一句,网上的教程大多都是你转载我的,我转载他的,大家互相抄来抄去,所以不能怪某度的搜索引擎不给力,主要是网页内容就是垃圾,搜索纵有回天之力,又能奈何。

首先下载MacTex [Read More…]

发表在 开源 | 标签为 | 留下评论

回归问题中的特征选择

在回归问题中,自变量的选择对回归的准确性(prediction accuracy)以及结果的可解释性(interpretation)有着至关重要的影响,尤其是在自变量数目较多的时候。当变量数多于样本数时,更一般的,在高维的情况下,自由度不足以估计所有的回归系数的时候,必须要进行变量选择。

基本上 [Read More…]

发表在 数据挖掘, 机器学习 | 标签为 | 留下评论

因子模型在推荐系统中的应用

因子模型在推荐系统中的应用

因子模型在基于协同过滤的推荐系统中应用日渐广泛,且推荐效果较好。

本文就探讨一下因子模型在推荐系统中的应用。

在基于用户-物品评分的推荐环境中,因子模型技术被证明(Netflix和KDDCUP竞赛中)为预测精度最高的单一模型。

1. 因子模型原理

因子( Factor) 模型假设每个 [Read More…]

发表在 数据挖掘, 机器学习 | 留下评论

相似性度量方法影响因素

相似性度量方法影响因素

现在探讨一下,相似性度量方法存在问题以及解决方法。

1. 冷热物品差异化

设想这样一种情况:两个用户同时评价了电影``Titanic'',但这对于推荐系统来讲,并没有提供多少有价值的信息,因为这部电影太火了,而如果两个用户对一个很冷门的电影做了评分,则这条记录提供的信息很有价值。即,让用户对 [Read More…]

发表在 数据挖掘 | 标签为 | 留下评论

推荐系统相似性计算

推荐系统中常用的相似度计算方法。

1. pearson correlation coefficient

计算两个变量之间存在的线性关系(积矩相关系数)

$$\rho_{(X,Y)}=\frac{cov(X,Y)}{\sigma_x \sigma_y}=\frac{\sum(X-\over [Read More…]

发表在 数据挖掘 | 留下评论