正太分布简介
本文将介绍概率论与数理统计中的一个重要分布—正太(高斯)分布。在机器学习中,很多算法都假定其先验分布是正太分布。几乎可以说,正太分布是最常用的分布。
最近因为工作需要,打算阅读一下spark的源码。首先研究一下spark是如何读入数据的。关于spark读取数据的机制,其实知乎上已经有大牛回答了,见@连城(内存有限的情况下 Spark 如何处理 T 级别的数据?),如果对spark源码已经有一定的了解,该回答还是非常形象易懂的。
好久没有更新博客了,今天来介绍一些基本的常用于Linux文本处理的shell命令,对于初入Linux任务的人兴许有一些帮助。本文不介绍命令的基础使用,只阐述一些能够提高效率的tips。
shell下的几个文本处理