为什么一个语言学习软件,能被 OpenAI 连投四轮?
2018 年 1 月,Speak 阻难在韩国上线应用商店。上线本日共 3 东谈主付费,收入 18 好意思元。这是 Speak 成立 3 年来第一笔用户付费收入。
Speak 是两位天才少年共同打造的一款 AI 语言学习居品。
一位名叫 Andrew Hsu,生于中国台湾,在好意思国长大,从小就是华盛顿各大媒体笔下的天之宠儿。Hsu 5 岁能解代数题,7 岁因太聪惠而辍学开动家庭教育(Home-schooling),用 1 年时间学完毕从小学到初中的课程;12 岁考入华盛顿大学,16 岁从华盛顿大学毕业时手持三个理学学士学位;19 岁成为斯坦福大学神经科学样子四年齿博士候选东谈主后辍学创业,成为 Peter Thiel"20 Under 20" 瞎想的一期学员,自后成为首位拿到 Google Venture 等著名 VC 投资的创业者。
伸开剩余94%另一位名叫 Connor Zwick,从 13 岁开动编程,曾被澳大利亚科技网 Nettuts.com 礼聘担任网站作家;高二时开发一款语言学习应用 Flashcard+,用户最高达 500 万,最终被上市教育企业 Chegg 收购。之后,Connor 入学哈佛,但只上了一年课便辍学创业,成为 "20 Under 20" 瞎想二期学员并雄厚 Hsu。
2016 年,二东谈主共同创办语言学习应用 Speak,试图借助最新的 AI 时期,打造一个 "AI tutor",让每位语言学习者享受到个性化教育,的确学会 " 说 " 英语。
为驱散这个宗旨,成立以来,Speak 团队用了几年时间反复观望 PMF。而上线首日的 18 好意思元让团队第一次看到但愿,也为今天的 10 亿好意思元估值写下序章。
" 小天才组合 "
2011 年,Peter Thiel 发起 20 Under 20 瞎想,饱读舞有想法的学生辍学或暂时休学创业。
同庚,年仅 19 岁的天才少年 Andrew Hsu 从斯坦福辍学,成为 20 Under 20 的一期学员,并创办 Airy Labs。Airy Lab 但愿针对儿童开发出能被家长们世俗认同的,具有教育羡慕的外走动戏,的确驱散 " 寓学于乐 "。
那时,Hsu 天才少年的光环,Peter Thiel 的背书,以及超前的教育理念让 Airy Labs 成为 VC 眼中的一颗新星。Airy Labs 成立不久便赢得 150 万好意思元种子轮融资,投资方大佬云集,包括 Google Ventures、Foundation Capital 和 Playdom 首创东谈主 Rick Thompson。拿到融资后,Airy Labs 的团队赶快推论至 20 东谈主,Hsu 也成为媒体口中的创业明星。
然而,一时快意无两的 Airy Labs 仅存活了不到 1 年。
Hsu 的天资并未在经营公司中体现,他的父母成为公司的确的掌舵东谈主,并逐渐将公司变成了一个 " 家庭作坊 "。
Hsu 的父母近乎像管孩子相似科罚 Airy Labs,他们制定的一系列科罚轨制在职工眼中齐很 " 恶运 "。举例,上昼 9 点到下昼 6 点弗成在办公室高声谈话,必须通过电子邮件或通信软件交流;部分红员需要在使命驱散后向 Andrew Hsu 或其父母请教使命,平淡比及晚上 9、10 点致使更晚才放工,况且每周平淡要使命 6~7 天。
" 科罚层与父母不同,他们确定不爱咱们。他们条款的使命时间在他们所在的国度可能是正常的,但在这里是不可接受的。我认为他们莫得凭证文化互异进行调遣。" 一位辞职职工曾牢骚。
除科罚问题外,Airy Labs 的辞职职工曾深化,公司并莫得清醒的愿景和策略布局。公司网站上描摹的愿景是 " 为儿童打造下一代外交学习游戏 ",但公司却没几个全职的游戏瞎想师。在这种情况下,公司却一连发布 7 款免费居品,几个月后才引入收费机制,导致公司一直烧钱,却莫得收入。
濒临如斯场合,Hsu 一度寄但愿于 A 轮融资能提供更多资金保管运转。但最终,职工们莫得比及 A 轮融资,而是减薪裁人、公司倒闭。
创业失败的警戒惨痛,但 Andrew Hsu 改变教育的和蔼却涓滴不减。恰是此次创业经历,他认知了 20 Under 20 瞎想的二期学员 Connor Zwick。
Connor Zwick 从 13 岁开动编程,曾被澳大利亚科技网 Nettuts.com 礼聘担任网站作家。高二时,Connor Zwick 一度对时下的教育体制感到失望,但愿用改变时期驱散的确的 " 因材施教 "。于是,Zwick 开发了语言学习应用 Flashcards Plus,用户不错把单词和短语的语音制作成电子学习卡片反复进修。
" 我那时的想法是,如若能将这些常识点汇总成某种常识图谱,就能生成任何内容、老师任何常识,并创造出一个无所不知的导师。"Connor 近期回忆谈。但显著,那时的时期水平难以得志这个愿景。最终,Flashcards Plus 寰球用户量达到 500 万,2013 年被教育科技上市公司 Chegg 收购。
之后,Connor 考入哈佛,在哈佛大学学习一年后,便拿下 10 万好意思元的泰尔奖学金和 Y Combinator 提供的 15 万好意思元投资辍学创业,开发了 Coco Controller,曾和 30 家游戏企业设立商酌。
直到 2016 年,Andrew Hsu 和 Connor Zwick 齐看到了在 AI 教育畛域再次登程的契机。
AlphaGo 投降李世石后,深度学习范式成为 AI 界的新热门,无数东谈主工智能论文问世,Andrew Hsu 和 Connor Zwick 在硅谷亲眼见证了一切的发生。
" 那时的模子愈加具体,比如语音模子、图像模子。咱们看到这些模子行将与东谈主类相似好,致使比东谈主类更好。"Connor 曾对媒体示意," 那时只是认为这东西很酷,想用 AI 来打造一些真义的东西。"
他们用一年时间研究 AI,致使到斯坦福蹭课学 AI。时间,他们尝试开发了各式不同的算法,还尝试过不少计较机视觉应用,举例用 AI 定制服装,或应用于医学影像测量东谈主体策划,以及用深度学习臆想天气。
但二东谈主发现语音识别是驱散最惊艳的。那时,他们在 YouTube 上立地荟萃了一些语音数据,构建了一个语音识别系统,不仅能连系用户谈话的内容,还能连系不同口音。
用立地数据西席的模子尚且有这样好的驱散,如若质地更高的数据呢?于是,二东谈主建议一个时期假定:是否能构建一种的确可用的居品,从中荟萃充足的用户数据,以供算法使用,改善建模,优化居品体验,进而获取更多的数据,变成良性的数据轮回?
在这个假定之上,Speak 成立了。
" 先有鸡 " 如故 " 先有蛋 "?
我们都知道,毛主席一生有多位女性好友,刘英也是其一,后来刘英经过毛主席撮合,使得她最后与张闻天结婚。
偶而是有了此前创业失败的资历,Speak 从创办之初就制定了清醒的发展旅途。
Andrew Hsu 和 Connor Zwick 二东谈主一致认为,除非学习者移居到英语母语地区,不然大约率只可学到一手 " 哑巴英语 ",无法正常交流。因此,Speak 的愿景就是为每一位用户打造一位个性化的 "AI tutor",让想学英语的东谈主能的确会说会用。
宗旨很清醒,问题在于若何驱散。
Speak 成立初期,团队遭遇了经典的 " 先有鸡 " 如故 " 先有蛋 " 的问题——要设立庞杂的 AI 模子,就需要无数多元、高质地的语音数据喂给模子。但要赢得数据,要么需要全程手动征集,成本腾贵;要么就需要创建一款不错荟萃该类数据的居品,但好的居品体验又设立在庞杂的模子智力之上。
量度事后,Speak 并未径直自研模子,而是在那时的时期水平下,先推出一款用户可接受的居品,跑通 PMF,用户逐渐增长后,Speak 再凭证用户数据微调我方的模子,变成数据飞轮。
开首,Speak 面向寰球推出居品作念用户测试,每个阛阓齐有 AI 对话功能,用户不错采纳一个类别,采纳心爱的话题和 AI 节略对话。但观望发现驱散并不好,用户基本会在居品发布 30 天后流失。
这个结局偶而并不料外。不同地区用户的学习需求、风尚文化配景不同,很难一概而论,况且语言学习阛阓本就竞争热烈,还是有 Duolingo、Babbel 等巨头占领阛阓,很难正面 " 硬刚 "。此外,那时的语音识别时期也不及以识别寰球各地的语音互异。
在 Andrew Hsu 和 Connor Zwick 烦懑之际,投资东谈主建议先把公司范围作念起来,但二东谈主很警惕这种作念法。直到 2023 年 6 月,成立七年的 Speak 也唯有 30 多名职工。
最终,他们决定先从单一阛阓攻破,以便集合元气心灵用有限的资源快速考证和迭代居品。
2019 年,Speak 阻难报复韩国阛阓。此前,Speak 进行了一番严格的阛阓调研。他们租了一个斗室间作念小范围的用户测试,给每一位参与测试的用户发一部测试手机,并全程记载用户的使用过程。
他们发现,用户的确使用居品的时间大多在通勤的时候。收拢通勤时段培养升引户的学习风尚后,用户在其他时间也会天然而然用 Speak 居品进修英语白话。
意志到这极少后,Speak 发现居品的使用量、飘摇率、留存率齐大幅进步,Speak 才算初步跑通了 PMF。但在 Hsu 看来,"PMF 不单是是单点的事物,而是一个一语气的过程。你检阅 PMF 的进程越大,迪士尼彩乐园为人类旧你的增长速率平淡就越快 "。
之后,Speak 不停更新址品功能和课程内容,并不停优化居品的交互瞎想。" 任何样子的器具教导、用户教育或功能阐发,齐意味着咱们的瞎想还不够完善。"Connor 认为,应把尽可能减少用户教育看成一个宗旨。而 Speak 将这极少作念到了极致。
许多语言学习 App 的内容会继承算法推选机制,新用户过问应用后,平淡会作念一份浅近的问卷或用户调换经由,采纳我方的学习动机、想学的内容等,算法会凭证用户反馈给其首页推选无数信息。但在 Connor 看来,这些信息并非的确灵验。" 畴昔咱们想要赢得有价值的信息齐要我方主动去搜索,而那些被推送过来的信息有 99% 齐毫无价值,比如垃圾邮件和推送示知。"
因此,Speak 借助 AI 智力打造了一个全新的界面解锁风景。
在居品首页,Speak 莫得给任何新用户调换经由,唯有一个浅近的问题:" 你为什么想学英语?" 然后用户就可按下 " 开动 " 按钮谈话。每个用户齐会用不同的热诚、语音语召回话不同的谜底。Speak 会凭证这些信息为用户构建个性化体验。
不外,Connor 曾示意,固然语音到语音模子驱散越来越好,但 " 语音并不老是最好的东谈主机交互风景,许多时候,打字和点击图标是更快捷的风景 "。因此,Speak 试图探索一种 " 羼杂界面 ",让用户不错在随时齐解放采纳谈话如故打字。
同期,为了更好地连系用户,Speak 在后台运行时,举例在夜间,模子会愚弄闲置 GPU 资源分析用户数据,从而领悟用户感羡慕的课程,并在第二天的学习中给用户推送新的课程。在 Connor 看来," 念念维模子 " 的确的价值正在于,即使用户莫得使用居品,模子也在后台不停处理着用户数据,分析用户需求。这种模式也决定,Speak 的居品迭代依赖于模子有更强的语音识别、连系和生成智力。
2022 年,Speak 遭遇 OpenAI,PMF 又有了质的飞跃。
绑定 OpenAI,自建 AI 团队
从 2022 年起,OpenAI 一语气四次投资 Speak。
OpenAI Startup Fund 成立于 2021 年 5 月,已投资数个 AI 应用样子,包括 De、Anysphere、Diagram、Harvey AI、Kick、Mem 和 Speak 等,涉猎 AI 音视频裁剪、AI 编码器具、AI 居品瞎想、AI 法律护士人、管帐软件等多个畛域的落地应用。其中,Speak 是唯独一个教育类软件。
对于投资的创业样子,OpenAI 平淡不仅给钱,还给时期。Speak 也不例外。
2023 年 3 月,Speak 先后官宣了和 OpenAI 的三项配合:
3 月 1 日,布告成为 OpenAI 全新 "Whisper" 模子 API 的首流配结伙伴。Whisper 有更强的语音识别智力,在处理带口音的语音以及无缝处理多语言语音(代码切换)方面的推崇更好。
3 月 14 日,布告其看成早期拜谒者,将 GPT-4 接入其 "AI tutor" 中,能让 AI tutor 驱散高度个性化和高下文干系的反馈。同期,GPT-4 能够生成更高准确度和连贯性的文本,让用户和 AI tutor 进行更当然、更有针对性的互动。
3 月 23 日,Speak 布告与 OpenAI 配合启动 ChatGPT 插件的 Alpha 版块,用户可从 ChatGPT 的界面径直拜谒 Speak。
但 Speak 并未把沿路但愿委托在 OpenAI 上。在和 OpenAI 深度绑定的同期,Speak 也在 2023 年入辖下手搭建了我方的 AI 团队,开动愚弄畴昔几年从居品上积存的数据集微调我方的语音模子。
2024 年,Speak 在官网博客中布告升级了中枢语音识别系统。
系统升级前,Speak 折柳在 iOS 和 Android 系统上运营着不同的 ASR(自动语音识别)系统,还会用自少见据西席端侧小模子适配特定型号的出动开荒,也会继承第三方语音识别就业。
但遥遥无期,Speak 便发现了一些缺欠。举例,为了因循比较老的开荒,Speak 使用了参数范围更小、计较智力较低的模子,对语音识别驱散较差;第三方语音识别就业常常也难以识别口音较重的语音,会影响用户体验;Speak 必须挽救 iOS 和 Android 两套语音系统,导致 " 事倍功半 "。
而系统升级后,Speak 基于里面数据集微调了 Conformer 系列的语音识别模子,该数据集包含了用户数千小时带有油腻口音的英语语音音频。
此外,Connor 认为:" 模子评估终点远程且缺欠。对于咱们的机器学习团队来说,最缺欠的可能是评估,终点是对于大型语言模子平淡实施的绽放式任务,如若你能够索求出无缺的评估圭臬,你基本上就索求出了你正在优化的宗旨问题。" 因此,Speak 凭证用户数据,构建了自界说测试集,主要评估语音模子凭证音频转录单词的单词不实率(WER)。评估发现,微调事后的模子单词不实率比通用模子镌汰 60% 以上。
里面 Speak 测试集上的单词不实率(WER),图片来源:Speak 官网
目下,Speak 微调的 Conformer-CTC 模子仅用于英语语音识别,但 Speak 深化,该模子翌日也将膨大到西班牙语等其他语言中。此外,Speak 还在开发超出单词除外的其他语音和语言模态(举例,用于发音反馈的音素)。
在用自少见据微调模子的同期,Speak 依然攥紧每一次与 OpenAI 配合的契机。因为在 Connor 看来," 语言学习和及时对话进修,是语音到语音时期的最好用例,因此咱们收拢契机与 OpenAI 配合,并将这项时期深度镶嵌咱们的中枢体验中。" 博客写谈。
2024 年 10 月 1 日,Speak 又与 OpenAI 配合测试了 GPT-4o 的及时 API,推出 Live Roleplays,使用户能够在各式变装上演情境中进行千里浸式、传神的白话进修。借助 GPT-4o 上的及时 API,Speak 的 AI tutor 不错像东谈主类教室相似快速或更快地反映,并能够连系并提供对于语音各方面的反馈,而不单是是纯文本转录,如语调、发音、韵律等。
不外,Speak 在博客中写谈,语音到语音模子的指示跟班智力仍然不如文本模子,目下还不擅长更简略的语言学习特定任务,如发音率领和反馈。
语言学习界最懂 AI 的公司
2024 年 12 月,Speak 布告完成 7800 万好意思金 C 轮融资,由 Accel 领投,OpenAI Startup Fund、Khosla Ventures 和 Y Combinator 等跟投。本轮投后估值 10 亿好意思元,Speak 也被看作大模子海浪中第一家的确以 C 端应用驻足的独角兽。
除赢得成本嗜好外,Speak 的居品推崇也得到阛阓认同。据 " 投资实习所 " 的信息,限度 2024 年 12 月,Speak 的 ARR 还是接近 5000 万好意思元,年增长率达到 100%。
Speak 主要的营业收入齐来自 C 端,莫得免费版块,只为用户提供七天免费试用,之后就按月或按年收费,收费圭臬分为 2 档:
Premium 瞎想:$99.99/ 年,每月 2000 个 AI tutor 积分;
Premium plus 瞎想:$234.99/ 年,每月 10000 个 AI tutor 积分。
(AI tutor 积分对应的是用户和 AI Tutor 的对话字数,每和 AI 对话一个词即 1 积分。)
在 Speak 的实质测试中,2000 家教积分学习 5 天就能破钞完,这也意味着对于有固定学习风尚的用户而言,Premium Plus 决策更合算。
2024 年,Speak 也开动拓展 to B 业务。Speak for Business 不错进修特定的商务对话,举例与供应商和客户的专科探讨等。目下,Speak for Business 领有跨越 200 个客户,职工继承率为 85%。
Speak 为何能在一众语言学习阛阓热烈的竞争中脱颖而出?谜底偶而就是 " 聚焦 " 二字。
Speak 自创立之初的宗旨就很聚焦,围绕 " 哑巴英语 " 这个核肉痛点打造居品体验,并一直宝石居品导向的念念路,络续迭代 PMF。最近的访谈中,Connor 示意 Speak 一直终点提神课程内容,目下里面仍会对 AI tutor 的课程内容进行 A/B test。
同期,两位首创东谈主很了了,其居品体验的迭代很猛进程上依赖于底层 AI 模子的智力。因此,在 OpenAI 强势爆发后,Speak 主动拥抱大模子。找到 OpenAI 这个强势的配结伙伴后,Speak 也并未在 AI 的火爆中迷失地方,盲目高估模子的智力,而是组建我方的 AI 团队,愚弄多年积存的用户数据微调语音模子,升级语音识别系统,陆续迭代居品功能。
套用近两年很致密的主见,Speak 是一个愈加 "AI 原生 " 的居品。比拟其他语言学习应用,Speak 更像一家时期公司。按对话积分破钞收费的模式,也和大模子按 token 破钞量计费的模式很相似,致使营销案牍也相应调遣为雷同 "20 分钟内说 100 句话 " 的标语。
同期,为了在单一阛阓打造最好居品体验,Speak 也十分提神居品瞎想和营销技巧的腹地化。在阻难过问韩国阛阓前,Speak 作念了充分的阛阓调研,并在后期搭建了一个宇宙级的腹地营销团队,凭证韩国阛阓的用户特质定制相应的营销策略,创建了一个独有的品牌形象。
Andrew Hsu 曾深化,限度 2024 年 12 月,Speak 应用的下载量已跨越 1000 万次, 每位用户每天的使用时间约为 10-20 分钟。
目下,Speak 正在将韩国阛阓的获胜资历逐渐带到其他阛阓进行考证。2022 年底,Speak 开动开拓日本阛阓;2024 年下半年,Speak 在中国台湾阛阓的收入开动快速增长。
不外,Speak 目下主要活跃在不以英语为母语的阛阓。比拟之下,西洋等以英语为母语的阛阓则由 Duolingo、Babbel 等老牌语言学习软件占领;微软、谷歌等大厂也对语言学习应用虎视眈眈,的确热烈的竞争风暴偶而还莫得到来。
来源:创业邦迪士尼彩乐园软件下载
发布于:江西省