Cos - cos.name - 统计之都
General Information:
Latest News:
R 中大型数据集的回归 26 Aug 2013 | 09:21 am
作者:Yixuan Qiu 原文地址:http://statr.me/2011/10/large-regression/ 译者:黄俊文 众所周知,R 是一个依赖于内存的软件,就是说一般情况下,数据集都会被整个地复制到内存之中再被处理。对于小型或者中型的数据集,这样处理当然没有什么问题。但是对于大型的数据集,例如网上抓取的金融类型时间序列数据或者一些日志数据,这样做就有很多因为内存不足导致的问...
医学统计学的渊源 23 Aug 2013 | 04:22 pm
医学统计学应该从什么地方开始讲起呢?多数授课老师的讲课方式是简要说一些医学统计学的概念,然后接着介绍医学统计学的内容、各种概念等。当然,这也是绝大多数教材的结构安排。 我们这里不是讲课,所以我不从这里讲,我们要像讲故事一样。你怎么才能tell story,让别人明白呢?我想首先要讲清楚这个故事的渊源,也就是来龙去脉。那么统计学的渊源是什么呢?所有统计学的发展,或者说统计学之所以存在,只有一个原因...
微博名人那些事儿(二) 22 Aug 2013 | 10:12 am
如何评价一个名人的热度?自然而然能想到的方法是,通过粉丝/关注比来评判其“风云”程度(好吧如果不考虑僵尸粉这种特色产物……><)。但实际上,在social network里面,我们真正面临的,是一个“网络”结构。让我们想想,消息在SNS里是怎么传播的呢?关注、粉丝、转发、评论 blablabla……所以,最近我在想,能不能利用这些关系来评判一个人的影响力? 首先面临的问题是,应该用什么样的行为表...
微博名人那些事儿 22 Aug 2013 | 08:35 am
微博,这一新生代大规模杀伤性社交武器近年来迅速在国内走红,其来势之汹,范围之广,威力之猛当不可小觑。通过它,我们不仅能第一时间八卦到身边柴米油盐、鸡毛蒜皮的小事儿,而诸如家国天下、业内前沿的大事记也难以逃过公众的法眼。 这样迅捷高效的信息传播是怎样做到的呢?相信每一个微博控都能如数家珍的道出自己心仪的几位微博名人们,不妨就从那些微博名人们入手,看看这些名人们身边的故事。 1、信息采集 信息采...
数据科学家访谈系列:谢梁(微软) 22 Aug 2013 | 06:49 am
谢梁,现微软(西雅图)高级数据科学家, 在各大SAS论坛混迹的朋友也许不知道他的真名, 但oloolo这个id可能大家都非常熟悉。 本站小编谢益辉有幸在西雅图得遇谢梁真身:本家相逢,又是同行; 把酒言欢,各自买单;幸甚至哉,采访即来。谢梁的个人技术博客。(因为现在不用SAS了,目前更新速度比较慢),更多信息, 参见LinkedIn页面。 1. 请介绍一下你自己 我2000年从西南财经...
使用R语言构造投资组合的有效前沿 20 Aug 2013 | 06:45 am
构造投资组合是金融投资分析中历久弥新的问题。多年以来,学界、业界提出诸多对投资组合进行优化的方法。比如,最经典的基于收益率均值和收益率波动性进行组合优化,由于马克维滋提出用收益率方差表示收益率的波动性,所以,这种方法又称为的 M-V 方法,即Mean-Variance 方法的缩写;后来,又衍生出基于夏普比率(Sharp Ratio)的投资组合优化方法;近年来,随着VaR (Value at Ris...
医学统计学系列 15 Aug 2013 | 08:30 am
非常感谢统计之都盛情邀请在卫生统计方面撰写系列文章,虽然我已经在自己的博客“卫生统计空间”写了百余篇统计文章,不过那些都是兴之所至,随手即兴而做,并无什么系统性。这次既然专门写这方面,我想尽量写得系统一些,所以这一次是第一次写,先不写具体方法什么的,而是写点学习统计最重要的东西,也就是医学统计学的重要性。 很多卫生统计学老师上课从不讲医学统计学是干什么的,有什么重要性,以至于好多学生毕业后依然不...
解惑rJava R与Java的高速通道 14 Aug 2013 | 07:30 pm
R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。 要成为有理想的极客,我们不能停留在语法上,要...
COS论坛精华帖系列——strsplit 的反函数 13 Aug 2013 | 09:30 am
我们知道,R 中的 strsplit 函数可以将字符串按照分隔符来进行分割。正如下面所示: 那么,有没有对应的“反函数”,就是说把以上的 splited_str 还原成为原来的 poor_str 呢?当然是有的,而且不止一种方法。 官方版本:paste 在 R 的 base 包之中,就有一个有用的函数,paste,它可以轻松地完成这个任务! 如果不用 collapse 参数… 很多人知道...
Rserve与Java的跨平台通信 12 Aug 2013 | 08:19 pm
R的极客理想系列文章,涵盖了R的思想,使用,工具,创新等的一系列要点,以我个人的学习和体验去诠释R的强大。 R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长。现在已不仅仅是统计领域,教育,银行,电商,互联网….都在使用R语言。 要成为有理想的极客,我们不能停留在语法上,要...