你的位置:首页 > 数据库

[数据库]数据分析/数据挖掘 入门级选手建议


1.数据分析和数据挖掘联系和区别
联系:都是搞数据的
区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力。数据挖掘偏算法,重模型,需要很深的代码功底,要码代码,很多= =。
 
2.怎么入门
请百度“如何成为一名数据分析师”或者“如何成为一名数据挖掘工程师”。英文好上Quora,不行上知乎,看看入门资料。
 
3.选哪些书
看入门资料给你提供的书,有电子版下电子版,没电子版买纸质书,花不了多少钱。
 
4.用什么语言
数据分析:excel是必须,R是基本,python是进阶。SAS和Matlab给土豪去玩吧。
数据挖掘:python是必须,java/c/c++是基础,hadoop/mapreduce/spark先掌握一点,因为并不是所有公司都有这么大的数据量。
 
5.需要学数学吗
都需要
数据分析:统计学,概率论,
数据挖掘:高数/数学分析,数值分析,线性代数,凸优化,运筹学(这些是基本)数字信号处理,模式识别,矩阵论(进阶)
 
6.要不要读研究生
一般来说,只有应届生去找工作会比较看重学历,因为你没有其他可以展示你能力的。但是随着工作时间久了(两年+),你的能力远超于你所在的学校,学历就不重要了。如果要读,建议读计算数学/概率论/模式识别/计算机 方面的研究生,争取发论文(高质量),否则应聘的时候并没有什么影响,当然,有些公司可能会在初筛的时候根据学历筛选人,正常,真想进就多工作几年再社招进去呗,学历不好也不能怪别人对不对。
工作几年后,如果觉得到瓶颈了,可以再去读书,没什么,这个时候可能你更清楚自己需要的是什么。
             
7.选择去哪个公司
大公司核心职位优先>>中型公司核心职位>大公司边缘职位>优秀的创业小公司核心职位>中型公司边缘职位>坑人的创业小公司边缘职位
原因:
1.大公司数据量多,人才多。能接触到核心项目核心职位是最佳选择。(BAT,网易有道,微软等)
2.中型公司发展快,机会多,压力大,成长快。(美团滴滴58)
3.创业公司慎选,如果有创业公司的offer,一看他们差不差钱,而看他们项目赢不赢利,三看团队技术氛围浓不浓。不差钱+盈利但技术氛围不浓,可以去,但不适合对技术追求高的人;不差钱+技术氛围浓但暂时不盈利,可以考虑,但要搞清楚盈利模式。盈利+技术氛围浓但现在差钱,可以考虑,争取成为核心成员,一旦融资不得了。如果差钱又不盈利技术氛围还差,算了吧,耗不起。
实在不知道怎么选,就看两点:1.数据量大小 2.技术氛围。钱少可以以后赚,技术氛围浓最重要。
 
8.怎么面试
1.诚实 2.真诚 3.展现你的潜力
 
9.没有项目经验怎么办
应届生要啥项目经验,本科生就说说自己的毕业论文,数模/ACM/阿里的参赛经历或获奖经历,以及可能会有的实习经历。研究生就说实验室的项目,负责的工作,完成的成果和发表的论文。不要夸大,如实说。
 
10.要不要培训
因人而异,但不建议。如果连搜索能力和自学能力都没有,就算你入了行,也会过得很痛苦的。更何况高昂的学费和造假的简历了。
 
11.到底该选数据分析还是数据挖掘
代码能力强直接搞算法,弱就先做数据分析,慢慢来,不着急。想我毕业的时候只会Matlab,后来被领导逼着两星期学了R,一个月学了python,自己在业余学了java,hadoop和spark等,也是一步步来的,不要想一口吃成个大胖子。
 
12.前途怎么样
我从实习到现在年薪翻了5倍,你说怎样。你要是只冲着钱去呢,去做销售吧;要是喜欢纯数呢,去做研究吧;要是喜欢从数据里发现一些有趣的事情并应用上去,那就来做数据分析/数据挖掘吧。
 
13.一天的工作大概是怎样的
到公司,跑数据,看结果,调优,跑数据,看结果,看论文,改代码,调优,跑数据,看结果。。。
 
14.有没有推荐的网站
google(之前被墙了,某个晚上恢复了,马上要回归了,现在不能用的话买个vpn吧,mac本推荐shadowsocks软件)
stack overflow:改bug神器
github:开源大法好!
Quaro:资料搜集地/经验借鉴处
(以及各类招聘网站:我不想学习的时候就看这个,看和自己理想的工作还有多少差距,打鸡血。。)
 
15.有没有推荐的IDE
sublime text+secureCRE/iterm够用了(mac本,windows的话就下个notepad++和linux就可以了)
各种语言的IDE都可以下一个,调试用。没有推荐,哪个顺手用哪个。
 
16.用什么电脑
有钱直接上服务器,没钱买个配置高的,实在没钱买个能敲的就行。以后工作有钱了再整个好的。
 
17.怎么投简历
校招有网申,我没有搞过校招,不太清楚流程。如果错过校招,最好去拉勾周伯通等垂直网站投。不太推荐58/赶集/智联,这些招聘网站上的职位类型主流偏低端,碰到不靠谱的公司概率较大。
 
18.怎么看岗位要求知道我的工作内容
一个简单的方法:所有数据分析类的岗位要求里写的要求会excel,PPT等的干的都是统计员的活!所有数据分析类的岗位要求里写的要求会GA,pu,uv分析的都是运营部门的!所有数据挖掘岗位里写的要求只有hadoop,spark,ETL的干的都是数据仓库的活!其他的自己看吧,数据挖掘有好几种职位:广告ctr预估的,机器学习的,推荐系统,自然语言处理等等。自己选择吧。反正入门都可以尝试做做。
 
总之,入门容易深入难,数学不好可以学,但会制约你的发展,代码不好也可以,但也会制约你的职业生涯,所以那些说“我觉得我数学不好代码能力也不强觉得R好难英语也不好看不懂国外的网站学多了会不会掉头发会不会找不到男/女朋友blahblah”的,你开心就好,你的职业生涯掌握在自己手中。
 
最后,感谢当初把我带入门的彭爱民老师,高芹老师和李海雄老师等等,好想回去看你们啊!!!!!!!
 
以上是工作半年以来想到的所有新入行的人可能会问的问题,以及我自己踩过的坑的一些总结,不全面,也没什么调理,大家将就看吧。除了以上问题有什么的再问我吧,上班时间不要问哦~(虽然下班也没什么时间,逗玩猫看看书刷刷手机就睡觉了  =  =)。
 
不要觉得我厉害,我觉得我到现在都是入门级,周围同事搞深度学习码代码码的飞起快被虐惨了,我是渣渣 = =
 
拜拜~学弟学妹们加油~