文章摘要
【关 键 词】 人工智能、机器学习、隐私保护、基因组学、科学写作
哈佛华人研究员Jeffrey Wang宣布加入OpenAI,担任基础团队研究员,负责模型预训练和推理。此前,Wang在哈佛一边教课一边研究机器学习。他于2021年本科入学哈佛,专业为数学和计算机科学,同时辅修英语。从2023年9月开始,Wang已在OpenAI工作。在哈佛期间,他为计算机科学和统计学系的61名学生讲课,并担任工程与应用科学学院研究员,主要研究方向为机器学习模型的鲁棒性和隐私性。他担任共同一作的两篇论文分别亮相NeurIPS SoLar(2023)和ICML(2024)研讨会。
第一篇论文《MoPe: Model Perturbation-based Privacy Attacks on Language Models》提出了MoPe这种新检测工具,帮助判断特定文本是否被用来训练过大语言模型。研究发现,MoPe比之前的方法更有效,可以更准确地模拟出模型参数变化对预测的影响。第二篇论文《Bias Begets Bias: the Impact of Biased Embeddings on Diffusion Models》研究了嵌入空间中的偏见如何影响扩散模型的公平性。论文提出无偏见的文本嵌入对于生成平衡的图像分布是必要的,并提出了减轻偏见的方法。
高中阶段,Wang因开发统计方法来探测3D基因组结构变化而获得国家级奖项,入围了再生元科学天才奖(Regeneron Science Talent Search, STS),这是美国历史最悠久、最负盛名的高中生研究竞赛,有美国“少年诺贝尔奖”之称。他与Abhijit Chakraborty博士合作两年,研究了染色体中DNA的结构,并创建了一个计算机应用程序,用于识别和排列不同细胞系基因组中这种排列的显著差异。该程序基于DNA的三维形状,能方便地定位重要的基因和路径,现已被50多个实验室使用。
此外,Wang还是一位小有成就的作家。他签约了《The Adroit Journal》和PBH Network长篇历史作家,作品在Quora分享历史、科学和统计方面的故事,总计超过600万次浏览。
原文和模型
【原文链接】 阅读原文 [ 1290字 | 6分钟 ]
【原文作者】 量子位
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★☆☆☆