透过论坛看股市(2):用户的地区和行业分布
数据已经基本采集完毕了,26万+的用户产生了10万+帖子和120万+的回复。这个数据量刚刚 好,不至于太多而导致=pandas=处理太慢,也不至于太少导致我觉得没意思。
首先拿论坛用户的地区和行业分布情况来练手,这个问题比较简单,通过它来学习=pandas= 的基本用法。
和上一篇一样,下面的内容同样可以打开jupyter nbviewer来访问
数据已经基本采集完毕了,26万+的用户产生了10万+帖子和120万+的回复。这个数据量刚刚 好,不至于太多而导致=pandas=处理太慢,也不至于太少导致我觉得没意思。
首先拿论坛用户的地区和行业分布情况来练手,这个问题比较简单,通过它来学习=pandas= 的基本用法。
和上一篇一样,下面的内容同样可以打开jupyter nbviewer来访问