Soft_Job 板


LINE

※ 引述《HWSH (光的夜生活)》之铭言: : 小弟去年从国立台北大学统计系毕业 : 计画先工作个两三年再去申请国外研究所 : 目前即将服完兵役 本来是希望年後可以开始上班 : 最近几天开始找工作 履历却一直被已读 : 感到一点小小的「挫折」 : 看了一下应徵者状况 六七成都是硕博 : 唉学历拚不过别人真的是硬伤 : 真的没有一些初阶的资料科学家助理工作可以做做看嘛哈哈 : 我很乐意从Data Cleansing的工作做起 : 交代一下背景 : 大概是大三决定要走资料科学家这条路 : 接触coding到现在大概两年 : 最常用的是R跟SAS : 有去修资工的资结跟演算法 : 会一点C跟Matlab : 最近在看线上课程学python : 英文听说读写没问题 : SQL还真的完全没碰过(满多职缺都有要求) : Deep learning几乎没有头绪(只知道ML) : Hadoop跟Spark只知道是在干嘛的也没有实际操作过 : 唉唉真的是太嫩了 : 想请版上的前辈大大们点一盏明灯提供一点建议 : 谢谢谢谢 用力鞭没关系 身为这一块的弱弱从业人员给你建议 我觉得你心态可能要改 资料科学家 70%以上的时间都在做data cleansing 但你好像搞错状况了 以为这种东西是初阶的工作 但是实际上并不是这样 实战经验上需要想办法增进把资料清整时间到可以拿去建模 在台湾 有意愿想做这方面的公司在过去对於资料的管理上都很不严谨 你看到的会是杂乱无章又一堆莫名其妙的资料 光是处理资料encoding的问题就够你烧脑烧时间的 更别说还有一堆杂事 如果你以为资料科学家只要爽爽地建模就好了那真的是太天真了 加上从你内文中没接触过SQL 没玩过Deep learning 好像也不会爬虫 资料视觉化的工具也没提到会不会 ML到底接触多深也不知道 要走资料这块只会R却不会python 也是硬伤 劝你先去了解一下R和Python彼此的优缺点 另外有没有实际上玩过什麽专案也看不出来 讲白了如果我部门开缺你来应徵 我还真不知道有什麽诱因让你进来一同工作 有个建议是如果真的想增进实力 上去Kaggle看看其他人在干嘛 同样的dataset你能不能做出跟人家一样的结果 或是去挑个竞赛区的试试看自己做出来的结果到哪 另外就是最近吹很大的各种相关“前景”请审慎看待不要一头热 有时候实务面上跟这些投机客炒作的泡泡还是有不小的落差 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.34.121.188
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Soft_Job/M.1518108879.A.FB1.html
1F:推 wilson85771: 推这篇 02/09 01:56
2F:→ jerry771210: 推推 02/09 02:13
3F:推 TAKADO: 10-15年前,大家都在跟风玩data warehousing 炒作data min 02/09 02:54
4F:→ TAKADO: ing种下的恶果啊,看过一堆奇葩系统各种没建pk fk constra 02/09 02:54
5F:→ TAKADO: ins,没有正规化,各种垃圾资料狂塞猛送,然後现在抱着这 02/09 02:54
6F:→ TAKADO: 些资料要来玩AI。 02/09 02:54
7F:推 laba5566: 嘴炮>>>>>>>狗屁ML+资料分析 不会嘴走这行是找死 02/09 08:52
8F:→ testPtt: nosql就是让你这样玩阿 02/09 09:40
9F:推 lichai: 正解… 02/09 09:43
10F:推 Abhoth: 楼上TA大的回覆深有同感QQ 02/09 11:29
11F:推 drajan: 你真的懂data warehouse吗?:) 正规化是要看场合来使用的 02/09 14:32
12F:→ askia: 推,一看就知道是内行。学术界老是讲一堆xxx方法、模型 02/09 19:26
13F:→ askia: 但是真正的实务只有三个要点:清资料、清资料还是清资料 02/09 19:27
14F:→ askia: 有乾净的资料一切都好谈,否则什麽都是屁。GIGO 02/09 19:27
15F:→ MOONY135: 哈哈哈清洁工 02/09 20:14
16F:推 lovdkkkk: 扫地僧4ni 02/09 21:01
17F:推 vfgce: 资料分析用'资料库正规化'会很想死吧...... 02/10 16:23
18F:→ vfgce: 至於清资料也不用讲得多神奇,主要是你对这个资料的了解... 02/10 16:24
19F:→ vfgce: 知道怎麽用,那些有用,那些杂讯.... 02/10 16:24
20F:推 vfgce: 资料分析常常是一个资料表拿来用,'正规化'反而造成麻烦... 02/10 16:27
21F:推 TAKADO: 楼上几楼说的没错 DW根本没有正规化的问题 02/10 16:46
22F:→ TAKADO: 但是在那个大家都在玩DW的年代一堆公司DB都刚起步 02/10 16:47
23F:→ TAKADO: 然後看是凹MIS去学或找便宜工作室帮忙弄 02/10 16:47
24F:→ TAKADO: 然後就出现了因为OLTP->DW时 ETL乱写进不去 02/10 16:48
25F:→ TAKADO: 但是DW是顾问开的 然後只好operational DB做去正规化到1NF 02/10 16:50
26F:→ TAKADO: 或是把DB跟DW混在一起做撒尿牛丸 设计成star-schema 02/10 16:53
27F:→ TAKADO: 这样就没有转资料的问题了,大家都开心 02/10 16:54
28F:→ TAKADO: 如果资料是靠爬虫或是open data去捞还好 02/10 16:56
29F:→ TAKADO: 如果是抱着整个资料库来的挺多雷 里面各种世界奇观都有 02/10 16:57
30F:推 shiauji: 推楼上大大跟这篇 02/11 10:18
31F:推 sailoruranu: 推 我之前做report也都一直在整理资料 老是有莫名奇 02/11 14:01
32F:→ sailoruranu: 妙的资料会被放进db 02/11 14:01







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP