Bot Friday 2022年第1次活动纪要
« Bot5 2021年第11次活动纪要: Bot5 Season 2021 Episode 11 «
Bot Friday Season 2022 Episode 1
- 时间:2022年1月7日 18:40 (北京时间)举办形式: 线上 Zoom + 线下
- 地点:句子互动,北京市海淀区智造大街F座5F
- 轮值主席:
- Chair: @lijiarui 李佳芮,句子互动创始人 & CEO
- Vice: @lhr0909 梁皓然Simon,广州先思科技CEO,前美国亚马逊工程师,Elastic认证工程师
Attendees
- 段清华,知未智能CTO,对话机器人爱好者
- 刘建,佟掌柜架构师
- 谢鑫,佟掌柜研发总监
- 李卓桓,希望能把 BOT5 沙龙做成自动化的状态机Actor研究者
- 李佳芮,一个聊天机器人式工作的CEO
- 王公子,chatBot产品经理
- 戴志康,伙伴云CEO,创业者
- 张文浩,Founder of Doodod
- 童子铨,THUCS,探索人机融合智能创业
- 徐昊,清青人财创始人,清华软件09级硕士
- 曹康龙,句子互动 管培
- 李丹,算法架构
- 梁皓然,先思科技CEO,开发智能客服系统
- 黄薇,伙伴云市场总监
视频
Talks
1. 总结2021可以用于对话机器人的一些技术发展盘点
- 分享人: 段清华,知未智能CTO,对话机器人爱好者
分享大纲:
- GPT与中文的GPT:盘古与CPM https://gpt.deepdialog.ai
- 语义相似度的进展:SimCSE https://www.sbert.net/
- 也许是该考虑换掉ES了:OpenSearch https://opensearch.org/docs/latest/search-plugins/knn/index/
- 用机器翻译扩充语料:一个trick https://huggingface.co/docs/transformers/model_doc/m2m_100
- 终于有一个相对可用的开源版中文TTS&ASR了:PaddleSpeech https://github.com/PaddlePaddle/PaddleSpeech/
- 按照惯例,只有英文模型的:Plato XL https://github.com/PaddlePaddle/Knover/tree/develop/projects/PLATO-XL
Slides
2. 低代码与企业微信的结合
- 低代码的前世今生
- 低代码的引擎构成
- 低代码应用场景
- 在企业微信中的延展
- 带来的行业客户成果
- 未来图景画面
活动纪要
本次有几位新人参与,欢迎他们!
脑洞
- 段清华:嗯,我就随便说一个,我不知道伙伴云或者是这些的代码有没有这样的一个功能,就是说因为看到你的官网也有那个和微信联动吗?那其实我我对于的代码,我很喜欢的代码的就某一种,就是它可以和类似于Excel那个互相操作的,就是powerpoint的那种感觉啊。然后我一直希望就比如说我们能就比如说快速的用扬声器,生成一个类似表单一样的东西。然后它也可以收集到Excel那样里面去,能完成一些比较快的一个操作,会限制它数据类型,我不知道以前现在有没有这样的功能,那基本上就这样是吧。
- 刘建:是听那个戴总分享了他的那个低代码,就是戴总说的是说那个可能的代码,更类似于说啊,从汇编到C,然后到上面VC是比如说现在一些脚本性的语言或者什么语言啊,但是我我想可能就是从我另外一个角度想啊,还是有那种所谓的生命是还是命令似的,就我想的代码的话,如果假如说我们能更多的去用生命式的这种东西去弄,可能会更好一些,就因为有一些这种东西啊,就是你只用生命他的逻辑。对吧,说明他的规则,但具体他怎么去做的,你不用去管,他就我不知道,就是说咱这个所谓的就是说这个低代码平台有没有说后面我只用就是因为我我特别希望就是说那个当时的那个周航跟我说过哈,就说比如说我们这个人工智能里面的,就是说这个聊天机器人来into的对吧,怎么去识别,我我我不用我不用知道他后面具体逻辑是怎么样的,说我要if else之类的,我我不用知道这个东西,我只用告诉他说,哎你帮我拿出来说这个会议的主题。
- 谢鑫:那个刚刚前面听到那个清华介绍有一个点,我觉得特别感兴趣,就是那个,它相当于把一个图片的描述性的文字和一个图片,他通过这个我不知道这个是一开始是需要有一个数据集已经训练好了,还是说能够给定任意一个图片就能提取出来这个描述性的文字,就是我在设想一个场景是这样,就是说,因为我们目前在做有一个业务是主要是做商品流通了,这样的话,上架的时候一般是需要能看到商品图片,但它是就是我们每次自己找图的时候发现一个问题就是。现在市面儿上有这种搜索引擎,是可以用这种时图性的软件儿的,就是你给他一张图片儿,他会给你给到那个相似性的这个图,但其实这个时候儿会出现很尴尬的问题,就是有时候这张图啊,你人眼看的时候儿的话,那个很难有一些比较关键性的这个信息来辅助你去用这种普通的文字性的搜索,这种引擎就是我期望结果是什么,可能我只有一张商品的正面图,我其实希望有这么一个东西。
- 李卓桓:然后这脑洞脑洞有三个啊,两个是跟清华有关系的,一个是志康有关系的,第一个呢,就是说我们脑洞的时候,我们在机器人会把每个人的脑洞文字转成文字啊,然后发到我们博客里,现在我们面临的问题就是说,其实大家呢,一分钟说的字儿还挺多的,他的博客里面的字儿特别多,刚才我就说,其实需要清华那个模型,就是把一长段话精简成为100个字左右,让每一个人的那个信息都特别有效,所以那个博客发的周边读起来特别好,这是第一个模型,我觉得特别有用,咱机器人就能用得上。那第二个呢,就是其实刚才也说了,如果同义词就是我们那个intent的各种同义词,如果能用那个模型来生成一批的话,其实会是能够解决一个平时机器人识别这个领域的问题啊,但这个可能还要再确认一下,所以这两个事儿,就岳清华一分享个特别棒的模型,能直接用起来,那另外一句志康刚刚才我说我觉得低代码和聊天机器人的结合,包括刘建刚才说的这个after party,咱们再细聊聊,我觉得这个是大有可为,五年前我就想干这个。
- 李佳芮:我一直最近一直在思考写代码的事情,就是因为我觉得自从有了云原声,然后所有东西都能在云上以后,其实写代码本身它就是一个逻辑的抽象。然后我在想,其实就刚刚戴总说的,其实我觉分为三块儿,一块儿是逻辑层,就是通过的代码,然后第二个就是云,那其实是能够减少运维部署的这种工作量。第三个层其实就是数据层,那数据层其实就是像清华刚刚说,把我们一直想做的,比如说。如果能用Google spreadsheet,就是那个,就是Google的那个在线的Excel,能够收集所有的数据,因为很多时候我们写代码,其实要收集个数,就是一个数据库,但真正读数据库对于正常的人是有成本的,但是对于正常人,大家读Excel是很简单的,所以如果把它们分为三块儿的代码,然后云,然后再加上一个Excel,其实我是觉得能做一切事情。
- 戴志康:就是以前有个话叫人类一思考,上帝就发笑,然后我觉得人类如果一思考machine learning的事情,上帝就会狂笑,为什么呢?因为上帝就在想是吧,我靠,你们这帮小子终于在思考,我是怎么布局这个世界的,所以我觉得这个事儿是我每次在听到讲这个,包括今天清华讲这些,这些背后的那些,那些算法,那些逻辑的时候。其实我觉得他某种程度上可能和我们真实世界的构成是完全一致的,我是一个坚定的程序论者,就是我们可能都是一个程序,而且现在我们就傻丁丁的在运行着自己的那个,那个分支。对说完了。
- 张文浩:我觉得今天两个分享,我觉得对我的这个启发都比较大,然后但我听下来之后,觉得有一个词可以概括一下,就今天我们两个演讲,我觉得这个词可能叫做泛化。为什么说泛化呢?因为我觉得前面的这个清华讲的其实是无监督学习,对吧?无监督其实对应的是有监督吗,但无监督为什么大家要搞他?我觉得其实是因为我们希望用无监督的方法,能够极大地去泛化,对于这个世界的这个这个理解,然后能够真正的去把我们的这个AI放到每个行业。然后边我们再看到这个的代码的时候,其实我觉得也是在解决泛化的问题。对,因为我觉得我其实刚刚也一直在想,就低代码和未来SaaS有,因为SaaS它是一个专业的这样一个服务,那跟低代码这种这种泛化的这种服务,那未来它应该是一个什么样的关系,对吧?那我觉得这个其实是一个,可能一会儿可以一起讨来讨论的一个话题,对,但我觉得今天最终我觉得还是有一点我自己要相信,就是坚信程序员是改变数字世界的核心驱动力!
- 童子铨:大家好,我是那个清华大学大四计算机系的凯文童子铨,然后我今天听到那个做那个智康在讲啊,,我之前是我大二和大三在做Ideation,就是要在跨,就是在对话,在线对话过程中,把对话中的某些词题去抽象出来,然后做成一种可视化的图,比如我们可以把话题或者问题或者知识做成一种物件导向的图。所以我等于是对chatbot 和低代码都非常感兴趣,然后刘建有说到那个decorative program,我后来一段时间就是在探索编程语言,还有一些系统的东西,然后我觉得他说的这个decorative program是一种更有表达力的方式,是我觉得未来我们用AI挖掘的东西,应该是这种最关键的一种结构。
- 徐昊:常感谢就是那个两位的精彩分享啊,然后我其实我我对,其实我是对今天那个戴总讲的那个内容点,其实我想我在想一个问题,就因为其实我们国内的就是国内也在说这个SaaS平台的SaaS平台,其实绝大多数可能to小B,他有些事情比较容易标准化,但是国内可能一些To B的企业可能突大比他会更容易挣到钱,对吧?就是客户他的这个就是需求,就是它的这个,就比如说他更愿意付费。部分能力会更强,那比如说但是呢,这种大B的这种客户,他的这种定制就是他会有很多这种定制的这种需求,所以我在想低代码的这个方式是不是会变成以后的,就比如国内的企业的这种解决方案,最后一个通用的一个一个方案。
- 曹康龙:其实今天感觉主要就是很多都在聊的代码的事情,就是我的话就是之前可能就是用过明道云,然后就是对他们的那个边界就是的代码的边界,感觉还是存疑,就是目前好像还是有挺大的局限的,对,但是他们其实也有边界对,嗯,对,然后就是觉得还是挺有意思的,这个低代码的可能是未来一个东西吧,就感觉像扮演上帝的角色,去封装一些东西。
- 李丹:关于的代码的,可能我之前了解的并不多,然后今天算是啊,老师给我开了一扇窗吧,然后听到对未来世界的一些想法和幻想,我就是也是很心情几,就是特别特别振奋,然后我就是希望在未来的分享里面,我能够突破,听到更多的这方面的分享吧。然后我我其实在实际的工作当中,就是面对的可能是就比如说对话机器人,最开始的这个阶段就可能。和低代码也也想要用低代码,如果说将来要是能够帮助我们解决这个问题是比较好的,就是说语料的问题,最开始的这个语料积累的问题,那如果一个产品没有在还没有卖出去之前,就是这个场景之下呢,是没有真实的用户语料的,那低代码能不能帮我们解决一些这样的问题?然后就是还有就是刚才那个段清华分享的那一部分,就是关于机器翻译,中文翻译成中文,这个我想也是对于语料的一个一个很好的一个补充,然后,但是给我更多启发的是那个多模态。嗯,就是说我,我可能我有一些场景,我能不能输入一些图片,然后返回来我很多很多语料,就是说你之前已经预习了好多好多的这样的一个苦,然后会不会出现这样的这样的一个结果,然后包括如果我要想要那个图片类的那一类的那个数据的话,那我能不能只是描述一下,然后就返回来,我很多图片就是这样,我可能想到的是这些。
- 梁皓然:我的脑洞就比较简单,但是和今天的这个话题挺相关的,就两个,两个主题就是最近我也在一直想的就是像这种大的语言模型,现在已经可以实现自然语言转代码,一定程度上的自然语言转代码的能力,然后现在有很多的代码的平台,我发现很多人其实是不会用一些很复杂的功能,或者不知道怎么样把一些功能实现的。所以我最近在做一个尝试,就是说,能不能就是让一个普通的用户用自然语言去实现它们,在低代码平台上面做连接的这些简单的代码,然后帮他们实现一些更高级的功能,在这些低代码平台上面。
- 黄薇:我主要其实今天还是看聊天机器人的,那我作为就是很看重用户体验的这种marketing的人,其实我一直在想,就是技术一直的这种改革和出现,是为了能够让用户有更好的体验,为了帮他们提升效率,能够过上更好的生活。但是我会发现其实这几年的各种技术的一个出现,反而会拉低人们的很多效率,比如说这种所谓的SaaS平台的出现,还有包括很多的软件,还有包括这种会议各家。公司都在去争相推出这类的软件,然后去占得一定的份额,但是却很少有人真正的去把一个比如生态做下来,或者说把一个功能全的东西做下来,它很多时候我们其实是在通过技术去牺牲一定的用户体验,来达到自己所谓的想要的效果。那拿聊天机器人来说,其实我特别不太喜欢的就是用这个东西,好像到到时间了。 为什么?就是,比如说我们之前有在群里面他的欢迎语,入群欢迎语,还有包括一些人的这种聊天,作为客服去聊,其实非常容易看到它就是一个机器人的一个状态,所以这个时候用户体验是非常差的,包括前面就是清华哥他分享的,这个就是根据一些比如好吧、好这些的肯定的词,其实从文字来说,它应该是一个看似起来是好,是OK的,是这个意思,但是其实文字里面是没法传达出人的情绪的。如果说未来的一个机器人,它能够让人感觉不再像一个机器人,它能够从各方面能够去识别人的情绪,把人的情绪作为一个判断,判断标准的话,其实可能会更容易提升用户的体验,让人更相信这是一个人在真情实表达出来的东西,而不是单纯的一个冰冷的机器。
吐槽
- 段清华:WIFI 需要更快好一些
- 刘建:那我来吐槽一下戴总,就是你这个人竟然还去写crud,居然还在那里一边接电话一边写crud,我觉得这个不应该哈,第二个吐槽你的话,就是居然API说没开放给大家去用,这个不够开放啊,就这两个。
- 谢鑫:我这也不算吐槽吧,就是希望就是,嗯咱们这些嘉宾分享这些PPT呀,能够直接发群里,然后因为有些资料比较快,我能直接再看一下回来。
- 李卓桓:就听了谢欣的这个吐槽,我第一时间我就想吐槽刘建,为什么呢?因为我们俱乐部是邀请制的,然后呢,邀请人要负责把俱乐部的情况告诉不邀请人,那我们俱乐部的习惯是每次活动之后,所有的PPT啊,包括视频我们都会发布在我的博客里面,所以如果你看看了我们上次活动的话,就看他效里面所有东西都有,包括PPT,所以这次我们也会在下次里面都有。那你刚才能提出那个问题呢,就意味着说,一个是你自己没有仔细的看,学习上次我们的活动的总结,同时呢,刘建也没有把这个信息传递给你所要吐槽刘建。
- 李佳芮:我吐槽这个现场的这个视频和整个这个流程,我刚才忽然反应过来,其实我可以直接把飞书的会议链接发到群里面,大家就是用飞书,然后飞书,也能录所有东西,也不影响后面的这个二次的博客的撰写,但是因为之前用zoom用习惯了,然后第一反应就是zoom套飞书,然后就套的乱七八糟。
- 戴志康:首先我们尊重尊重流程啊,但是这个我昨天晚上两点钟下班儿回家,然后呢,看到佳芮又给我发了一条消息,说说戴总你要报名啊,不报名只能下次了,我想这不对,然后我就去就就去报名,然后呢,我拿打开电脑打开那个链接,哎呀就什么都没看到,我就看到只有上一次的回回放回顾,然后也没有一个回复的地方,我想这怎么回事儿呢?然后呢,这个我又跑到手机上啊,这个这个打开,哎,手机上神奇的发现,在里边儿欠了那个那个那个页面啊,欠了那个页面,然后我又去这个这个回复等回复完了,大概02:30了,就搞这事儿搞了半小时,哎呀真是太痛苦了[流泪],太痛苦了[流泪]。
- 张文浩:我觉得因为上一次我作为主席嘛,对,然后回头我也走一遍整体的流程,我觉得其实在这个主席的这个角色上,就是确实门槛还是有点高啊,因为我觉得其实确实我有一段时间也没有编程,就我们整体这个发那个PR出来的话,还需要下载整个的环境,我当时因为我特别希望能自己把这个东西完成,所以我就自己重新又下载了很多环境,然后加加载了很多包,然后,然后那个我在测试的时候还得在这个。再上去做这个测试,就整个这个发布post的一个周期,我也吐槽下自己吧,这个周期确实拉的有点长,单我还是希望我们是不是可以简化一下这个主席的工作量,让我们这个主席的门槛降下来,这样的话有更多人愿意去当主席是吧?
- 徐昊:啊,其实我我就是我觉得就是我觉得这次活动特别好,本来我没有什么能吐槽的,但是呢,就是尊重咱们的流程,必须要吐槽。然后呢,我我就觉得可能今天整个也就是整个活动参与下来,就是活动之前我报名的那个环节,我在手机上面,我真的是花了大概半个小时,我报名才成功,我觉得你们真的可以试用一下,也是跟戴总碰到同样的问题,我开始是手机端,然后没有成功,后来是手机上试了好几回,又在电脑上弄,最后我也是搞了半个小时才才报名成功的,对我这个也可以说一下。
- 李丹:那我就吐槽一下今天来的过程吧,因为路途比较远嘛,然后我就觉得我差不多快要迟到了,但是之前我是不知道咱们可以视频参加的,我也不知道会zoom,然后等我从一楼跑到了五楼,我发现群里面发了一个zoom 的链接,然后当时我就想吐槽了。
- 梁皓然:我主要就是稍微吐槽一下卓桓,就是花太多时间在钻研那个Xstate的架构了,其实简单撸一个出来试试,然后再迭代会更好。
- 黄薇:吐槽两个点吧,第一个点就是这个微信群,真的是太复杂了,这个规则我作为marketing的人,现在也没有特别搞清楚是什么时候,为什么要带这个群,我可能觉得就是群他的一个目的,他会有,比如说不同的一个目的属性吧,会更好一点,然后如果频繁的进不同的群,反而会有点容易混淆。然后第二个问题就是,其实线下的一个小的沙龙是非常好的,但是人数今天会有一点点少,如果未来可以增加人数的话会更好一点。
轮值主席任命仪式
下周轮值:
- 主席: 梁浩然
- 副主席: 段清华
集体合影
After party
RSVP
- 如果对活动纪要有修订或补充意见,请回复对本次活动纪要留言;
- 副主席请在活动纪要发布后24小时内,以回复的行使发布Vice Chair Supervisor Report
- 参加下次沙龙活动报名要求:回复“姓名、个人的一句话介绍(如果是新人)、推荐人(如果是新人)、是否参加 After Party 🍻”。鼓励大家在报名中提交自己愿意分享的话题进行登记(完整话题列表在这里);
Comments