studyabroad 板


LINE

身为一个搞高分子模型 加上最近实验室想转去做polymer informatics的人 看到有人想跳进来来分享几句 先简单提一下我的背景 大学主修物理、专题主要做胶体分子的泳动(实验+理论) 目前美东科技大学化工所博四、题目主要两个: 1. polymer network形成的模拟、topology quantification、以及机械性质预测 2. polymer informatics,目前主要是设计专用於高分子的representation、 data schema,还有弄一些简单的高分子ML 我想分几个方向来谈一下 首先是关於念不念phd跟念甚麽的点 在推文里面有提到你是想找教职的 如果你很笃定,那phd非念不可 但作为一个念到後期,看到身边的人怨念愈来愈深的人 我建议规划的时候多考虑一点後路 不是说不要有理想有冲劲去念书做研究 而是就算我们系上整天号称全美化工系教职有超过1/3都我们系友 摊下来我们一届50人有15-20人真的最後找到教职就不错了 现在还没毕业,旁边就好几个同学决定不考虑找教职了 尤其是你永远不知道会不会在你要找教职的cycle发生甚麽奇怪的事情 像是谁知道今年会疫情爆发,突然很多学校不太敢招人 况且接下来几年美国估计经济不会太好,教职竞争应该会异常激烈 不过你还没开始念,所以到时候说不定景气已经回弹了 你比较需要担心的是你想找的老师这波会不会饿死没经费 就像原文推文有提到的,把phd当一个工作 原文有很多很好的建议,不要只考虑东西看上去过几年前景怎麽样 而是要思考一下这些钱都是哪来的 反正就是去算毕业的时候可能的情况 把最好的跟最坏的都算进去,挑一个你可以接受的 --- 再来是怎麽丢的点 这分两个层次: 1. 你怎麽先弄出第一张大表,把你可能有兴趣的program都抓出来 2. 怎麽把这张缩减到最後可操作的清单 第一部份我建议多管齐下 首先,就像你说的,去看paper,去研究有哪些program有适合的老师 先不要管他们实际上在甚麽系,找到的全部列下来 接着,看看你有兴趣的题目都对应到甚麽系,然後开始横向去看看其他学校类似的 program有没有也有你有兴趣的老师 这样顺藤摸瓜重复几轮,你就有你的大表了 当然,这样很累,因为基本上你要做的功课会是单纯瞄准化工所的5-6倍 如果客观条件上不允许,那就先另外订条件筛掉一部分的系 像是我自己当初申请,大学念物理系,想说换换口味 看看工程一点的人在干嘛 就直接把物理系都先筛掉了 第二部分就扯到你最後的名单怎麽选了 这个很多版友都分享过了 基本就几个梦幻区,你不要管太多你自己的qualification,上了赚 几个比较实际的,最後几个比较保险的 这部分最重要的考量是你到底上的机会多大 然後因为你"转领域",你要打听好是一开始就得写说要找informatics的人 还是有没有可能先上了再去找其他教授 其他系我不知道,但化工系很多都是committee在收人 所以其实进去之後做甚麽题目很难说,看你跟哪个老板最後互相看对眼 SOP其实可以挑最强的方向来写 像我们系,基本禁止你进来之前先讲好要跟谁 所以可以先挤进来之後再来想办法挤进你想要的实验室 这种只能说,多打听,多问问实际状况 (然後顺便推销一下我们学校的PPSM http://polymerscience.mit.edu/ 进来之後全校搞高分子的PI都能选 不过我不是这个program的....) --- 再来是关於你提到的领域的观察 其他地方不知道,美国化工现在绝对是大ML时代 甚麽东西都在往哪边靠 Chem/bioinformatics绝对是热门中的热门 只是所有用statistical tool/ML来研究的都是广义的informatics 你首先需要厘清的是,在你想用informatics的方法的前提下 你有兴趣的到底是甚麽样方向的研究或是应用 原文中提到了高分子,刚好跟我自己的题目方向有关,我就从这边聊聊 你有兴趣的是拿informatics来搞高分子的哪一块? 你是想从应用端出发,像是针对生医材料或是其他材料(像是电池) 来做高分子开发吗? 还是你也愿意去做更基础的,去研究怎麽把有机化学那边QSAR的东西、生物资讯那边的工 具、或是其他的ML工具,开发成适用高分子研究的东西? (这些不一定是单选,但多想想你自己是比较对特定应用有兴趣,还是对整体方法有兴趣 ,对建构你自己的技能树会比较有帮助) Polymer informatics相对化学资讯跟生物资讯,是发展非常缓慢的一个学门 主要问题不在於没有後端的统计分析工具,也不在於没有data (跟化学比,跟CV或是NLP比当然……跪求data set) 而是大部分的data以informatics角度来说不是太难用,就是根本不能用 一堆古老的paper/handbook 全都是写给人看的格式,很难自动化把资料爬出来 一大堆甚至不是文字档…… 甚麽,你说NLP+OCR? 大哥,你一定没读过高分子文献 爬高分子名不够 (喔对,聚苯乙烯有1800种名字喔 [1] 你还要爬他的分子量 他的dispersity 他的composition 他的tacticity 他的regiosequence……. (你的聚乙烯不是你的聚乙烯,更不是我的聚乙烯 这些大多没有标准定义跟标准的data schema 甚麽,OK的,你能搞定? 那你能不能顺便写个CV程式帮我解SI里面的解析度神差的GPC curve 顺便帮我把NLP+CV爬到的资讯再整合一下? 更麻烦的是 有时候这些资讯还是间接推出来的 像是你合polymer graft,你的分子量根本不是直接量的 而是你先量过backbone的分子量 再去solvolysis量graft的分子量 可能从头到尾你压根就没直接对你的polymer graft做过测量 NLP再猛你也抓不到你需要的资讯 喔对,我们还没讨论processing, morphology, phase separation 跟其他大尺度或是非平衡的东西 简单来说就是高分子系统一点都不乾净 光是两篇号称研究同一个高分子的文献可能都很难做apple to apple比较了 更遑论你还要把这些东西丢进model里面跑 现阶段我只能说good luck,小心GIGO 然後不要想太多甚麽Graph NN或其他炫泡ML模型 我猜random forest完虐其他选手 (另外我很好奇原文提到的用ML预测机械性质的文章 rheology复杂起来实验怎麽诠释复杂到哭 我很难相信现阶段的模型能处理这麽乱的东西 是GA tech的polymer genome系列的文章吗) 这种时候就会很羡慕cheminformatics跟bioinformatics 你一组SMILES或是一组核酸序列就定义了你的系统 而且还有ChEMBL或是PDB这种神器 只能说贵圈真有远见,数位高分子资料库目前只看到polyinfo一个真的能用的 基本上相较chem/bioinformatics这些很成熟的领域 Polymer informatics目前还是在泥淖中慢慢爬的阶段 当然这不见得是坏事,甚至可以说是好事 相较於其他地方战国时代,杀出一条血路很困难 这边还算是有空间 只是你得有心理准备 你要干很多脏活 很脏很脏,脏到你要去过去30年的文献里面打滚 手动慢慢annotate资料的程度 当然也有另外一种做法 那就是拿模拟的资料出来用 这也是一块很有潜力的领域 不论你是能把高分子模拟用ML模型加速 或是能从现有的trajectory抽出更多的资讯 都对整个material discovery loop,甚至是基础的高分子物理很有帮助 --- 回到原文的问题 你该准备些甚麽? 以一个半路出家的高分子人士来看 最核心的还是你要脚踩你原本的专业,然後听得懂其他人在干嘛 所以依你的biomaterial背景,尤其是看起来你有wet lab经验 如果能补上你说的那些python/ML/algorithm/stat mech 其实就很足够了 你这样的背景已经比我们实验室搞polymer informatics的人都强了(包括我) 美国人很流行合作,就算是我们系上N年一见的神人,毕业直接拿系上offer的 (我们系一般的policy是不收自己博士班或博後当faculty) 也都是跟隔壁csail的ML专家合作 所以其实除非你就是想完全的转去做ML,先脚踩核心专业(模拟/化学/材料...etc 然後再把自己变成双语(CS+X),才是最有效的做法 (欧洲合作的传统更强,我猜情况类似,有待版友补充) 如果你提的那些都做到了 这样你不但听得懂做模型的那端在干嘛 也知道实务上实验数据的一些眉眉角角 这种背景其实很难得,因为大部分的人都只会一边 然後不用担心 你这题目绝对不冷门 你要担心的是这东西会不会你还没念完就热到泡沫化 -- 废话这麽多,希望多少有帮助 --



※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 71.233.156.119 (美国)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/studyabroad/M.1586071601.A.925.html
1F:推 joshua40302: 推大神 04/05 15:34
2F:推 peterqlin: 有神快拜<(_ _)> 04/05 15:34
3F:推 jump120: 推大神 04/05 15:38
4F:推 pgsa: 推大神 04/05 18:51
5F:推 ryanpaul1021: 推大神 04/05 19:16
6F:推 jimmy0405: 推大神 04/05 20:01
7F:推 erictaur: 看完受益良多 04/05 20:25
8F:推 space20021: 推宙斯 04/05 20:38
9F:推 a1933464522: 推 04/05 20:58
10F:推 thid5335: Coley真的扯 04/06 00:40
真的扯
11F:推 ron0908: 太神啦,光听就觉得累XD 04/06 00:47
12F:推 jimmycolor: 看到大神先推了! 04/06 01:13
13F:推 Faker5566: 美东科技大学XD 04/06 01:20
14F:推 coldlee: 钓出好多神人... 04/06 01:43
15F:→ coldlee: 美东科技大学是三小啦XD 04/06 01:44
没讲错R,美东私立科大啊
16F:推 TingTT: 受益良多,所以基本上都要有一些coding能力会比较好? 04/06 02:09
通常是 毕竟不论你是做模拟还是做其他modeling 会写程式都只是基础而已 当然有极端情况 像是我老板就有收一个不会python的进来 但他的工作主要是搭整套processing跟自动化合成的流程出来 拿active learning来选实验接下来要做甚麽只是顺便做 (不过没想到现在进不去实验室 变成full time写code..... 但这毕竟是少数 通常博士班还多少愿意培养 但从不会写code开始对老师风险有点大 系上主要做软物质模拟的老师 要是你完全没有模拟或统力背景 会很委婉地劝退你
17F:推 WTF1111: 推,钓到好多好棒的回应,羡慕原po 04/06 02:18
18F:→ WTF1111: 美东私立科大 XD 04/06 02:19
19F:推 bnn: 原来是美东科技学院XD 04/06 07:51
20F:推 unmolk: 美东科技大学XDDDDD太神啦 04/06 07:55
21F:推 chieher: 公虾毁 XD 我整篇都看不懂但是推 04/06 12:14
22F:推 physics11: 看到是神人,小弟我就跪着回覆了 04/06 12:55
23F:→ physics11: 首先谢谢大大前面对於教职跟经费的打听,十分受用 04/06 12:55
24F:→ physics11: 再来是我想要应用informatics来探讨高分子的机械性质, 04/06 12:55
25F:→ physics11: 例如:我想知道用Ml来找出critical H-bond density可以 04/06 12:55
26F:→ physics11: 让高分子流动行为改变,而非一直trial and error来找。 04/06 12:55
27F:→ physics11: 不过我自己知道这很难, 04/06 12:55
ML有可能拿来做这个 不过trial-n-error之外 物理模型跟模拟常常也能给出还可以的预测 所以除了想说要用modeling来预测之外 还要想想你有兴趣的问题 现在实际的痛点在哪 ML为什麽可以解决现在的困境 是有多的资料吗? 还是你能做自动化的合成 可以自己选你要的资料? 还是单纯现在计算太慢 你要train一个模型跳过模拟花时间的步骤? ML应用炸开很大一部份是DL的效果实在太好 资料够多可以自动抓出对的representation 对应到化学这边 也有很多fancy的模型 像是各种GNN 或是拿SMILES去套NLP的东西 不过这些东西通常很data hungry 很多时候化学的dataset你随便random forest效果还比较好 如果只是简单的model的话 20年前就有像Bicerano, van Krevelen之类的 各种group contribution theory或是手凑出来的correlation 这种模型其实预测力常常很惊人 你模型没建好估计连他们baseline都比不赢
28F:→ physics11: 因为高分子合成类的paper最让人诟病的是-你反应有很多 04/06 12:55
29F:→ physics11: 因素是不会在paper里头呈现的,诚如大大讲的,你的PS不 04/06 12:55
30F:→ physics11: 是我的PS,就算做了分析,有许多characterization的方 04/06 12:55
31F:→ physics11: 式也是值得存疑的(就真的如同大大提的,溶液聚合来推 04/06 12:55
32F:→ physics11: 你grafting onto的分子量这方法就是一个问号) 04/06 12:55
33F:→ physics11: 不过我还是希望能有跟版大类似的环境去尝试polymer inf 04/06 12:55
34F:→ physics11: ormatics,但之後饿不饿死我这几天会去找资料打听看看 04/06 12:55
35F:→ physics11: 至於我之前说的那篇paper好像也是来自美东科大的,我待 04/06 12:55
36F:→ physics11: 会把doi传过去XD 04/06 12:55
37F:→ physics11: 经过大大解说,我才知道原来这在美国是大热门...之後对 04/06 12:55
38F:→ physics11: 这领域有进一步的问题可以私讯大大吗? 04/06 12:55
没问题啊 可以私下问 也可以推文我回版上
39F:推 b98901056: 推大神 未看先猜有私立科大xd 04/06 14:02
40F:推 D81E61G12G18: 推! 04/06 15:24
41F:推 sumon: 朝圣推! 04/06 19:21
42F:推 ddbsky: 朝圣推 04/06 19:21
43F:推 lzc851031: 朝圣个美东科大...... 04/06 20:07
※ 编辑: tzyyshyang (71.233.156.119 美国), 04/07/2020 11:28:11







like.gif 您可能会有兴趣的文章
icon.png[问题/行为] 猫晚上进房间会不会有憋尿问题
icon.pngRe: [闲聊] 选了错误的女孩成为魔法少女 XDDDDDDDDDD
icon.png[正妹] 瑞典 一张
icon.png[心得] EMS高领长版毛衣.墨小楼MC1002
icon.png[分享] 丹龙隔热纸GE55+33+22
icon.png[问题] 清洗洗衣机
icon.png[寻物] 窗台下的空间
icon.png[闲聊] 双极の女神1 木魔爵
icon.png[售车] 新竹 1997 march 1297cc 白色 四门
icon.png[讨论] 能从照片感受到摄影者心情吗
icon.png[狂贺] 贺贺贺贺 贺!岛村卯月!总选举NO.1
icon.png[难过] 羡慕白皮肤的女生
icon.png阅读文章
icon.png[黑特]
icon.png[问题] SBK S1安装於安全帽位置
icon.png[分享] 旧woo100绝版开箱!!
icon.pngRe: [无言] 关於小包卫生纸
icon.png[开箱] E5-2683V3 RX480Strix 快睿C1 简单测试
icon.png[心得] 苍の海贼龙 地狱 执行者16PT
icon.png[售车] 1999年Virage iO 1.8EXi
icon.png[心得] 挑战33 LV10 狮子座pt solo
icon.png[闲聊] 手把手教你不被桶之新手主购教学
icon.png[分享] Civic Type R 量产版官方照无预警流出
icon.png[售车] Golf 4 2.0 银色 自排
icon.png[出售] Graco提篮汽座(有底座)2000元诚可议
icon.png[问题] 请问补牙材质掉了还能再补吗?(台中半年内
icon.png[问题] 44th 单曲 生写竟然都给重复的啊啊!
icon.png[心得] 华南红卡/icash 核卡
icon.png[问题] 拔牙矫正这样正常吗
icon.png[赠送] 老莫高业 初业 102年版
icon.png[情报] 三大行动支付 本季掀战火
icon.png[宝宝] 博客来Amos水蜡笔5/1特价五折
icon.pngRe: [心得] 新鲜人一些面试分享
icon.png[心得] 苍の海贼龙 地狱 麒麟25PT
icon.pngRe: [闲聊] (君の名は。雷慎入) 君名二创漫画翻译
icon.pngRe: [闲聊] OGN中场影片:失踪人口局 (英文字幕)
icon.png[问题] 台湾大哥大4G讯号差
icon.png[出售] [全国]全新千寻侘草LED灯, 水草

请输入看板名称,例如:WOW站内搜寻

TOP