Hugging Face 2023 实习生招募计划

Hugging Face 2023 实习生招募计划

想参与到 <王婆卖瓜>「最酷的 AI 社区」</王婆卖瓜>,共同构建未来吗?今天,我们为大家分享 Hugging Face 的 2023 年实习生招募计划,希望可以有国内的同学申请或转发,与你未来的 Hugging Face 导师们共同研究 AI 和机器学习中的前沿问题。

我们欢迎不同背景的申请者,如果你可以提前了解我们的使命并跟我们一样为之感到兴奋和动力满满,那你就是「确认过眼神的人」!

职位申请说明

  • 我们是一间「Distributed Company」,默认情况下,我们的工作地点都是「Remote」
  • 实习生工作地点视具体情况而定,如果导师有地点的偏好,我们会在职位列表中注明
  • 申请人需要具备一个 Hugging Face 的账号
  • 我们有很多开放性和完全远程的社会招聘机会,欢迎在我们的工作职位网站查看更多: hf.co/jobs
  • 我们相信英文和网络探索能力对于 AI 科研人和从业者并不是问题,因此开放职位部分的内容直接取自官方博客,如果你想申请,请点击阅读原文到官方博客查看并申请

开放职位一览

The following internship positions are available in the Open Source team, alongside maintainers of the respective libraries:

  • Accelerate Internship, to lead the integration of new, impactful features in the library.
  • Skops Internship, working at the intersection of model serving, persistence, and interpretation as well as model card generation.
  • Diffusers Internship, helping on distilling diffusion models for faster sampling.
  • Evaluate Internship, helping on the backend of the library to improve its performance & focus on integrating with other libraries in the ecosystem.
  • Speech internship, working on efficient models for speech recognition.

The following Science team positions are available:

  • Code Generation Internship, working with the BigCode team on cutting edge large language models for code.
  • Model Forgetting Internship, investigating model forgetting using state of the art “unlearning” methods.
  • Multimodal AI Internship, working at the intersection of natural language processing and computer vision for the next generation of large multimodal models.
  • OCR Internship, incorporating textual information directly into multimodal models.
  • Video Pretraining Internship, exploring pretraining for the video modality.
  • Retrieval Augmentation Internship, investigating “semiparametric” retrieval augmentation methods for more consistent, more interpretable, and more efficient language models.
  • Embodied AI Internship, working with the Embodied AI team on reinforcement learning in simulators.
  • Distribution Shift Internship, developing a toolkit for detecting and measuring distribution shift in datasets.

The following other internship positions are available:

  • Social Impact Evaluation Internship, developing a technical framework for assessing the overall social impact of generative ML models.
  • Gradio Internship, working with the Gradio team on expanding the ecosystem.
  • Benchmarking Transformers Internship, deploying and benchmarking transformer models for both training and inference.
  • AI Art Tooling Internship, bridging the AI and art worlds by building tooling to empower artists.

招聘声明

Hugging Face 正积极努力建立一个重视多元、平等与包容 (DEI) 的文化;我们会非常在意并致力于打造一个令人相互感受到尊重和支持的工作环境,不论你是谁或者来自哪里——我们坚信这是建立一个伟大公司和社区的基础原则。同时,我们致力于提供平等的就业机会,不会因种族、肤色、族裔、宗教信仰、性别、民族起源、性取向、年龄、国籍、婚姻状况、残障、性别认同或退伍军人身份而区别对待任何人。

本文转载于网络 如有侵权请联系删除

相关文章

  • 亿级流量架构之分布式事务思路及方法

    什么是分布式事务 在日常生活中,很多事要么全部做,要么全部不做,不能只做一部分,不然就会产生其他复杂的问题,很多人喜欢举转账的例子,对于同一个账号,A在湖北往出转500,B在广东取钱500,那么A转出去之后要将A账号的钱数目扣除,B账号数目增加:事务=(A账号扣除500,B账号增加500)看到没,像这样多个步骤放在一起,就是事务,要么都执行,要么都不执行,如果我们的数据存储在多个数据库中,也就是存在跨库调用,由于网络具有不安全性以及延时性,如何保证事务分布式执行呢?如果执行到一半断电又该如何处理?在讲解分布式事务之前先简单回顾事务的一些特点,俗称ACID,下面逐一讲解:原子性(Atomic)在化学中,分子构成的物质,分子是保持化学特性的最小单位,如H2O,CO2H2O,CO2等,由原子构成的物质,原子保持物质特性,像FeFe啥的,意思就是不可分割,再分成质子中子啥的就不是我们认为的物质了,这儿的原子性也是这个道理,就是事务不可以再拆分,例如上面的事务,看着可以是由两个过程组成的事务,但是你拆开就不是我们认为该有的过程,所以,事务不可再分,具有原子性。一致性(Consistency)一致

  • MySQL | 数据库的基本查询

    数据操作语言:普通查询记录查询最基本的查询语句是由SELECT和FROM关键字组成的SELECT*FORMt_emp; SELECTempnpo,ename,salFROMt_emp;复制SELECT语句屏蔽了物理层的操作。用户不必关心数据的真实存储,交由数据库高效的查找数据USEdemo; SELECT*FROMt_emp; SELECTempno,ename,salFROMt_emp;复制使用列命名通常情况下,SELECT子句中使用了表达式,那么这列的名字就默认为表达式,因此需要一种对列名重命名的机制。SELECT empno, sal*12AS"income" FROMt_emp;复制SELECTempno,sal*12AS"icome"FROMt_emp;复制查询语句的子句执行顺序SELECT empno, sal*12AS"income" FROMt_emp;复制语法分析与优化读取SQL语句FORM选择数据来源SELECT选择输出内容数据分页比如我们查看朋友圈,只会加载少量部分信息,不用一次性加载全部朋友圈,

  • S7-1200与MCGS的高效组态(下篇)

    JZGKCHINA工控技术分享平台尊重原创勿抄袭勿私放其他平台前言PLC和HMI是目前自动化系统中最常见的控制设备,不管是工作多年的工控老鸟还是新入行的工程师,想做自控这行,第一个需要玩转的就是它哥俩。为了帮助大家高效的组态PLC控制程序和HMI触摸屏的联动,使工程项目实施更加高效、方便和标准,我们推出了两个系列文章来:1.上篇–西门篇(S7-1200与MCGS的高效组态(上篇))2.下篇–昆仑篇(本篇)在上篇中,我们做好了S7-1200PLC部分的程序块和接口数据,在本章下篇中将主要介绍MCGS方面的操作。最后会模拟一下两边的运行效果。01接口数据回顾一下上篇内容,把接口数据列清楚:02HMI组态新建一个工程,组态好通讯。然后我们新建一个窗口,设置为启动运行,并插入几张位图。如下图所示:白色图标代表水泵待机、绿色运行、黄色警告、红色故障;M手动、A自动、L就地、R远程03标签数据库我们点开一个图标,然后点击表达式右侧的小问号,再选“根据采集信息生成”标签。1.通道类型因为是DB块,所以选择V寄存器2.通道地址中小数点前边代表DB块编号,后边代表偏移地址3.数据类型DWord,选择32

  • Node.js的底层原理

    前言:本文根据最近做的一次分享整理而成,希望能帮忙大家深入理解Node.js的一些原理和实现。大家好,我是一名Node.js爱好者,今天我分享的主题是Node.js的底层原理。在大前端的趋势下,Node.js不仅拓展了前端的技术范围,同时,扮演的角色也越来越重要,深入了解和理解技术的底层原理,才能更好地为业务赋能。今天分享的内容主要分为两大部分。第一部分是Node.js的基础和架构,第二部分是Node.js核心模块的实现。一Node.js基础和架构Node.js的组成Node.js代码架构Node.js启动过程Node.js事件循环二Node.js核心模块的实现进程和进程间通信线程和线程间通信ClusterLibuv线程池信号处理文件TCPUDPDNSNodejs组成Node.js主要由V8、Libuv和第三方库组成。Libuv:跨平台的异步IO库,但它提供的功能不仅仅是IO,还包括进程、线程、信号、定时器、进程间通信,线程池等。第三方库:异步DNS解析(cares)、HTTP解析器(旧版使用http_parser,新版使用llhttp)、HTTP2解析器(nghttp2)、解压压缩库

  • 更相似的价值观,更多的信任?——价值相似性对人主体交互中信任的影响(CS)

    随着人工智能系统越来越多地参与到决策中,从用户那里获得适当程度的信任也变得很重要。要实现这一点,首先要了解哪些因素影响对人工智能的信任。我们发现,在人工智能信任中个人价值观的作用方面存在研究差距。因此,本文研究了人与主体价值相似度(VS)是如何影响人类对该主体的信任的。为了探索这一点,89名参与者与5个不同的代理组队,这些代理与参与者的价值相似程度不同。在一个基于场景的实验中,特工们给出了进入大楼解救人质时该怎么做的建议。我们分析了主体在主观价值相似性、信任度和开放性问题的定性数据上的得分。我们的结果显示,被评为具有更多相似值的代理也在信任上得分更高,这表明两者之间存在积极的影响。有了这个结果,我们通过提供对价值相似性作用的洞察,增加了对人类-代理信任的现有理解。原文题目:MoreSimilarValues,MoreTrust?--theEffectofValueSimilarityonTrustinHuman-AgentInteraction原文:AsAIsystemsareincreasinglyinvolvedindecisionmaking,italsobecomesimpor

  • 从源码分析常见集合的区别之List接口

    说到Java集合,大家肯定脱口而出List、Set、Map,(想不出来的请自行面壁),今天就详细聊聊大家耳熟能详的List吧。List接口实现自Collection接口,是Java的集合框架中的一员,List接口下又有ArrayList、LinkedList和线程安全的Vector,今天就简单分析一下ArrayList和LinkedList的异同以及各自的优势。ArrayList引用ArrayList集合中的一段注释:/** *ThearraybufferintowhichtheelementsoftheArrayListarestored. *ThecapacityoftheArrayLististhelengthofthisarraybuffer.Any *emptyArrayListwithelementData==DEFAULTCAPACITY_EMPTY_ELEMENTDATA *willbeexpandedtoDEFAULT_CAPACITYwhenthefirstelementisadded. */ transientObject[]elementData;//non-p

  • 开始尝试一下soap,用python访问

    实验一下天气预报Webservice服务,数据来源于中国气象局:http://www.webxml.com.cn/WebServices/WeatherWebService.asmx?wsdlpython的程序:如果需要库支持,下载地址:http://pypi.python.org/pypi?%3Aaction=index 推荐使用:setuptools,安装后可以使用easy_install很方便安装fpconst:easy_install.pyfpconstSOAPpy下载地址:http://pywebsvcs.sourceforge.net/>>>fromSOAPpyimportWSDL >>>wsdlFile=‘http://www.webxml.com.cn/WebServices/WeatherWebService.asmx?wsdl’ >>>server=WSDL.Proxy(wsdlFile) >>>server.methods ---------------------------V {u

  • linux 科普

    Linux基本常识Linux诞生的故事Unix篇:为了进一步强化大型主机的功能,让主机的资源可以提供更多的使用者来利用,所以在1964年,由AT&A公司的贝尔实验室(Bell)、麻省理工学院(MIT)及奇异公司(GE美国通用电气公司)共同发起了Multics(多路信息计算系统)的计划,Multics计划的目的是让大型主机可以同时支持300个以上的终端机连线使用。贝尔实验室有个叫KenThompson的人也参与了这个项目,并在Multics操作系统上开发了一款叫做"星际旅行"的游戏.不过,由于Multics计划的工作进度太慢,资金也短缺.所以1969年,贝尔实验室退出了Multics计划.那年的某一天,他的妻子带着孩子要回娘家探亲一个月,KenThompson为了打发自己无聊的时光,同时也为了可以继续玩他的"星际旅行".于是乎,他就决定写一个操作系统来移植自己的游戏.于此,Unix的雏形,UNICS就诞生了.只不过此时的UNICS是用汇编语言写的.移植到其它计算机上需要改很多源代码,很不方便.于是,他又开发一门编程语言---B语言,用B语言

  • Unicode编解码函数

    在用XMLHTTP进行远程数据传输的时候,如果涉及到不同编码,比如从oblog向我的博客发送一个trackbackping,数据中包含的中文字符就会出现乱码。为了解决这个问题,可以在发送之前,把所有的数据中的中文都进行Unicode编码然后再传输。这样就可以顺利解决问题。但是有时候还会涉及到另外一个问题,就是到了目标程序后,要进行数据库检索,发送过来的中文字符串都已经编码为类似&#32462这样的Unicode编码,而数据库中的数据虽然以unicode编码保存,但是却还是中文字符,并没有表示为&#32462这样的形式。这就导致检索失败。为了解决这样的问题,我只好采取这样的办法:发送端对中文字符串进行Unicode编码,接受端接收后进行Unicode解码,还原为中文字符。这两个函数如下:'************************************************** '函数名:AnsiToUnicode '作 用:转换为Unicode编码 '参 数:str----要转换的字符 '返回值:转换后的字符

  • css height属性中的calc方法

    例如父盒子是100%的高度 盒子里面的head部分固定位140px 内容部分始终为剩余的全部高度 height:calc(100%-140px);   "+或-"两边要有空格不然不生效     父盒子.pushQueryPanelContainer{ height:100%; } 内容部分 .pushQueryPanelContainer.queryTable{ height:calc(100%-55px); margin-left:10px; margin-right:10px; }复制 calc()函数用于动态计算长度值。 需要注意的是,运算符前后都需要保留一个空格,例如:width:calc(100%-10px); 任何长度值都可以使用calc()函数进行计算; calc()函数支持"+","-","*","/"运算; calc()函数使用标准的数学运算优先级规则; 支持版本:CSS3 语法   calc(expression) 值描述 expression 必须,一个数学表达式,结果将采用运算后的返回值。

  • overflow:hidden解决高度塌陷原理

    https://www.jianshu.com/p/4473bffef8a0?utm_campaign=maleskine&amp;utm_content=note&amp;utm_medium=seo_notes&amp;utm_source=recommendation 我们大家理解的overflow:hidden是超出该元素的部分进行隐藏,这个时候就需要明确一点,该元素的高度是怎么定义的。当一个div中的两个元素浮动之后,此时div的高度就会塌陷,此时div的高度为0。那是不是意味着就要将浮动元素隐藏起来,如果是真的隐藏就是反布局常识的。那是因为你不了解BFC机制。 定义:BFC(BlockFormattingContext)全称是块级格式化上下文,用于对块级元素排版,默认情况下只有根元素(body)一个块级上下文,但是如果一个块级元素设置了float:left,overflow:hidden或position:absolute样式,就会为这个块级元素生产一个独立的块级上下文,使这个块级元素内部的排版完全独立。 作用:独立的块级上下文可以包裹浮动流,全部浮

  • CGO,基本数据类型转换2 和 函数调用

    CGO涉及的数据类型转换包含一下内容: 数值类型 字符串和切片类型 结构体、联合体、枚举类型‘ 数组类型 指针类型 数组和指针间的转换 切片和切片之间的转换 前面3个咱们在上一篇短文已经梳理到了,接下来继续 数组类型 C语言里面: 数组 C语言里面,数组名对应一个指针,指向特定类型特定长度的一段内存,但是这个指针不能被修改 C语言的字符串是一个char类型的数组,字符串的长度需要根据表示结尾的NULL字符的位置确定 字符串 是一个char类型的数组 切片 C语言没有切片的概念 GO语言里面: 数组 数组是一种值类型,而且数组的长度是数组类型的一个部分 字符串 就是一段长度确定的只读byte类型的内存 切片 是一个简单的动态数组 从上面我们可以看出来,C语言和GO语言的数组,切片,字符串的相互转换,就可以是指针和指针指向的内存长度的转换 CGO官方给咱们提供了如下5个函数,用于C语言和GO语言互相转换: funcC.CString(string)*C.char C.CString将传入的go字符串,克隆成一个C格式的字符串,克隆出来的字符串是使用C语言中

  • Bayesian Optimization使用Hyperopt进行参数调优

    超参数优化 BayesianOptimization使用Hyperopt进行参数调优 1.前言 本文将介绍一种快速有效的方法用于实现机器学习模型的调参。有两种常用的调参方法:网格搜索和随机搜索。每一种都有自己的优点和缺点。网格搜索速度慢,但在搜索整个搜索空间方面效果很好,而随机搜索很快,但可能会错过搜索空间中的重要点。幸运的是,还有第三种选择:贝叶斯优化。本文我们将重点介绍贝叶斯优化的一个实现,一个名为hyperopt的Python模块。 使用贝叶斯优化进行调参可以让我们获得给定模型的最佳参数,例如逻辑回归模型。这也使我们能够执行最佳的模型选择。通常机器学习工程师或数据科学家将为少数模型(如决策树,支持向量机和K近邻)执行某种形式(网格搜索或随机搜索)的手动调参,然后比较准确率并选择最佳的一个来使用。该方法可能比较的是次优模型。也许数据科学家找到了决策树的最优参数,但却错过了SVM的最优参数。这意味着他们的模型比较是有缺陷的。如果SVM参数调整得很差,K近邻可能每次都会击败SVM。贝叶斯优化允许数据科学家找到所有模型的最佳参数,并因此比较最佳模型。这会得到更好的模型选择,因为你比较的是

  • 软件工程与“足够好”

    今天看了北航软工课程学生写的一篇博客[1],刚好可以借此机会把我这几年关于软工的思考整理出来。 我在2016年做过福大OO课的助教,以及在2017年做过集大的软工助教。当时我有很多地方都没有做好,并且这几年没怎么关注软工课程,与教学一线脱离较久,说的东西不一定对,大家随意看看就好。 为了确保我理解了上述博客的内容,我会先尝试对博客做个总结,然后选择标题“足够好”作为切入点说说我自己的一些粗浅的看法。 博客说了啥 博客的一个关键背景是团队项目选题,详细内容在: https://edu.cnblogs.com/campus/buaa/BUAA_SE_2021_LR/homework/11925 选题方式有三种:自选题、推荐选题、继承往届选题。不同选题方向对团队关于所选题目有不同的要求(这里课程组没有充分地把要求清晰地表达出来)。选题和需求分析的时间限制是4天(周末两天),同学们面临的来自时间压力比较大。由于本次选题后的需求答辩邀请了业界人士和大众评审团,需要事先提供各团队的相应资料给他们,助教面临的完成度压力也比较大。 在第四天,助教团队发现部分学生团队未提供上述需要提前给相关人员查看

  • 5965. 相同元素的间隔之和 前缀和

    给你一个下标从0开始、由n个整数组成的数组arr。 arr中两个元素的间隔定义为它们下标之间的绝对差。更正式地,arr[i]和arr[j]之间的间隔是|i-j|。 返回一个长度为n的数组 intervals,其中intervals[i]是arr[i]和arr中每个相同元素(与arr[i]的值相同)的间隔之和。 注意:|x|是x的绝对值。 来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/intervals-between-identical-elements 著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。 设ABCD三值相同,他们的下标分别为abcd 观察,寻找规律 b+c+d-3a=a*(0+1)-[a]+[b+c+d]-a*(4-0-1) b-a+c+d-2b=b*(1+1)-[a+b]+[c+d]-b(4-1-1) 2c-a-b+d-c=c*(2+1)-[a+b+c]+[d]-c*(4-2-1) 3d-a-b-c=d(3+1)-[a+b+c+d]+[0]-d*(4-3-1) classSol

  • Mybatis实现批量更新sql语句(SSM实现批量更新sql语句)

    https://blog.csdn.net/qq_36132599/article/details/89148708   https://blog.csdn.net/dmcpxy/article/details/81163735 梅花香自古寒来

  • (13)中值滤波和双边滤波

      其实中值滤波,就是那九个数值,进行排序,选择中间的数值来代替那九个数的中间位置的值,然后再从左到右,从上到下,这样移动运算 ================================================= ============================================================================ 下面是均值滤波和高斯滤波的基础知识 ============================================================================= ======================================================================== 中值滤波基础知识 ================================================================= =========================================================

  • IDEA常用快捷键

    ctrl+F12:查看当前类方法 ctrl+r:替换 ctrl+shift+↑/↓:行移动 ctrl+shift+f:全局查找字符 ctrl+shift+n:全局查找文件 ctrl+shift+r:全局替换 ctrl+shift+u:大小写转换 ctrl+shift+enter:自动结束代码,行末添加; ctrl+alt+←/→:跳转编辑位置(注意屏幕旋转快捷键) ctrl+alt+l:格式化代码 Ctrl+Alt+B:进入接口方法的具体实现 Ctrl+Alt+H:查找方法被调用的地方 Ctrl+shift+Alt+U:查看maven依赖,类图 Ctrl+Shift+E:最近更改的文件 Ctrl+Shift+Backspace跳转上一次修改的地方 ctrl+alt+o:优化导入的类,可以对当前文件和整个包目录使用 CTRL+ALT+T:常用代码块,if...else、try...catch等 ctrl+f:查找当前文件 ctrl+d:复制行 ctrl+y:删除行 alt+7:显示类结构 Alt+Insert:代码生成(get、set) Alt+F1:查找代码所在位置 Alt+F3:逐

  • 盘点系列--常用开发软件篇

    盘点系列--常用开发软件篇 作为一名计算机专业的学生,我来盘点一下我常用的开发软件 简单声明一下,我是主要学习Java后端开发的,虽然学校的课程啥语言都学,但是毕竟还是用的少,因此主要分享的也是Java后端开发常用的软件。 后端编辑器 1.IntelliJIDEA 如果你学习过Java,那么你肯定知到IDEA。你也肯定听说过Ecplise,两年前我写Java一直用的都是Ecplise,在之后用了IDEA之后,表示IDEA真香!! IDEA和Ecplise对比,有点像是智能手机和诺基亚。IDEA的代码提示、补全功能彻底甩Ecplise一条街。依然记得在用Ecplise开发时,因为在xml文件中因为写错一个字母找一下午bug的情景。 如果当你在开始学习Java犹豫该使用哪种开发工具时,选IDEA就没错了! 前端编辑器 1.VisualStudioCode VSCode用处就比较多了,因为现在前后端分离的趋势。VSCode在前端开发中占有非常大的比例。 我日常使用VSCode主要就是开发前端页面、刷LeetCode、写简单的小脚本等等。 当然,VSCode的灵魂是它的插件!而VSCo

  • day11(acl权限/特殊属性/su与sudo)

    小扩展: 1.哈西算法加密: [root@localhost~]#md5sum1.txt d41d8cd98f00b204e9800998ecf8427e1.txt复制 一:acl高级权限 1.定义: ACL(AccessControlList)权限是UGO权限的扩展,ACL可以针对单⼀⽤户、单⼀⽂件或⽬录来进⾏r,w,x的权限控制,对于需要特殊权限的使⽤状况有⼀定帮助。 目的是设置个人的权限; 2.单一用户实现某一个权限 如果o=rwx的话,所有的其他用户都有权限 [root@localhost/]#setfacl-mu:user01:r/test/1.txt #给user01对1.txt文件设置可读权限 [root@localhost~]#chmodo=x/root 设置/root目录对user-1的-x权限su-user01'vim/root/1.txt'#验证是否可以进行有读的权限也可以给目录设置格式:setfacl-mu/g/o(主,组,其他三选1):用户名/组名/:权限文件/目录(1)当属主的对应用户名时候,意思为只有该用户对该文件或目录拥有权限(2)当为属组时候,意

  • 20170319 - pycurl 提示 libcurl link-time version is older than compile-time version

    使用condaupdateanaconda升级后,运行程序得到如下提示: ImportError:pycurl:libcurllink-timeversion(7.45.0)isolderthancompile-timeversion(7.52.1) 网上查解决办法,如下: pipuninstallpycurl exportPYCURL_SSL_LIBRARY=openssl pipinstallpycurl复制 实际中,执行两次 pipuninstallpycurl复制 再执行 pipinstallpycurl复制 即解决。  

相关推荐

推荐阅读