Machine Learning Phd机器学习全奖博士申请经验分享!!
本文适用于所有ML Phd申请同学,想在国际科研领域方面有所发展的同学
一.Research directions:
1.监督学习supervised learning任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做一个好的预测。用户将成对的输入和预期输出数据提供给算法,算法从中找到一种方法(具体方法不用深究),然后根据给定输入给出预期输出。
4大基本理念①输出空间、特征空间和输出空间 ② 联合概率分布③假设空间④问题形式化
2.非监督学习 Unsupervised learning:非监督学习 是指在没有类别信息情况下,通过对所研究对象的大量样本的数据分析实现对样本分类的一种数据处理方法。
3.自监督学习 self -supervised learning基本上是机器学习的“最理想化”的状态,模型直接从无标签中自行学习,无需标注数据。
在图片和视频中的应用如下:①图像着色②图像分辨率③图像修补④预测Cross-Channel预测
4.强化学习 Reinforcement learning 智能体agent 如何在一个复杂的环境/不确定的环境中极大更好的发挥它的奖励。
① Reinforcement learning (Essential elements)
三大基本要素 three Essential elements:状态state /观察值Observation动作action奖励 reward
两部分 two parts:智能体agent 和环境 environment
二.无监督学习(Unsupervised learning)和自监督学习(self -supervised learning)的区别 difference:
①自监督学习self -supervised learning来源于数据本身的内容,也就是自己给自己的监督信号(self 的meaning),基本上可以认为是实例级别进行标注,Each sample is a class.
②所以,如果按照有人为标注信号是有监督,那么自然监督分为无监督。按照有监督信号为有监督,那么有监督有监督划分到有监督范围。
三.MLphd 申请学生背景
background/课程courses/科研 research /paper要求:
Background:申请ML方向的学生大都是来自于电子工程/计算机科学/信息工程等专业。大都来自海本/我国985的学生, AL方向申请难度大,对学生成绩科研要求也很高。
courses:1.熟练拥有编程能力,e g: Python C++ Java等,要求有数据科学的基础EG: SQL数据分析等可视化工具,能够熟练的掌握并运用,同时熟悉一些软件开发的工具也很关键。
researches :科研方面,海外科研项目会占优势一些,直博还是注重科研经历含金量导师的title.硕士毕业的话申请还是看文章一些,影响因子越高的情况下,基本上 TOP 项目类似CMU 被录取的概率越大。
四.直博申请ML PhD:
一般直博建议从大一大二就开始规划相关的科研,直博的话难度还是比较大的,适合本科背景比较好海本/国内双一流,并且有科研规划的同学,一般海本直博的学生也会比较多些.科研资源相对丰富,以及我国清北上交复的也有很多直博的案例,关于直博的GPA要求一般建议直博的话最好在3.5+/4.当然如果你的科研能力很优秀能够证明你的能力,或者说你有SCI顶会级别的文章。绩点低于3.5,其实也是可以的嘻嘻,低于3.0/4就不建议考虑直博了,关于科研的含金量国内学生可以参加些海外交换项目,也会有助于拿到美国教授的推荐信。
你本校科研资源丰富的话,一定要尽旱和导师搞好关系,大一/二就开始去规划相关的科研项目,等到申请之前就晚了。如果你的科研足够优秀,你可以尝试直博申请!
美本背景可以参考2024Us news计算机排名。
国内本科国内人工智能高校参考:清北/南京大学/浙江大学/中国人民大学/复旦大学/上海交通大学这些高校都具有人工智能人才的培养计划,开设人工智能学院,具有美国交流的机会,以及海外合作项目。
五.硕士期间如何规划ML Phd申请:
本科科研不足,需要一个硕士背景去获取,补充科研资源。硕士期间绩点不建议低于3.0+/,建议最好3.5+/4.研究生期间最好有1-2篇文章的发表证明你自己的学术能力,因为本科的话其实没有文章看重科研潜力,硕士的话还是得有科研文章的。建议一上研究生就开始去规划相关的科研,去实验室和自己的导师搞好关系,家庭条件允许的话美硕是一个好的跳板.也有助于你拿到美国教授的推荐信~什么样的 paper算是对申请有帮助的?最好是类似于 SCI顶会级别 的话含金量会高一些,或者至少是1作的文章。不然水刊没办法证明你的学术能力,说白了,你要往你的CV上去写你的成果的!GRE这块的话320+,达标就可以了,把大部分时间花在科研和发文章上才是重点!
美硕跳板参考:
CMU-ML (王牌项目)
UCSD -ML 硕士热门必备保底项目
University of Wisconsin--Madison -ML
直博更看重科研能力和潜力,那硕士毕业申请更看重你的科研成果,也就是你
paper的含金量。SCI几区几作,以及影响因子的情况.
六.ML(AI)国际文章引用情况,(机构+学校):
ML区域引用最多的文章,来自美国三大科技公司Google Meta Microsoft,还有13家单位,高校占比更多。只有3家企业相关机构,包括Deep Mind/Open Al和MIT,
但都是美国企业其中我国清华大学/剑桥大学/新加坡国立的学生录取较多。引用最多的是美国,第二名是中国。
七.就业岗位+美国公司推荐
Data bricks 美国软件企业公司:源于UC -Berkeley的AM P Lab项目,该项目参与了Apache Spark的制作,这是一个基于 Scala 构建的开源分布式计算框架。该项目开发了 Delta Lake主要是研究机器学习。
Unisphere Software Systems是一家会话自动化技术公司。
Nuro 是一家美国机器人公司.
Move works Moveworks是一家美国人工智能公司,总部位于加利福尼亚州山景城 Moveworks在2021年AI突破奖中被公认为最佳聊天机器人解决方案,在2019年、2020年和2021年入选《福布斯》AI50强
客服电话:0451-88855666
公司地址:哈尔滨市南岗区西大直街151号