Elastic 作为赞助商将莅临会议现场,Elastic 社区首席布道师刘晓国也将亮相大会并作出精彩演讲。
-
时间地点 会议时间 会议地点 技术交流4月10日-4月12日
北京万达嘉华酒店
主题演讲:《基于 Elasticsearch 创建企业 AI 搜索应用实践》
讲师:Elastic 社区首席布道师 — 刘晓国
个人简介:新加坡国立大学硕士,西北工业大学本硕。曾就职于新加坡科技,康柏电脑,通用汽车,爱立信,诺基亚,Linaro 非营利组织 (Linux for ARM),Ubuntu,Vantiq 等企业。从事过嵌入式软件开发,电脑设计,手机软件设计,汽车电子,计算机操作系统,通信,云实时事件处理等行业。欢迎大家来参阅 Elastic 官方中文博客 https://my.oschina.net/u/3343882
议题简介:
传统的词汇搜索不能满足当今时代的需求,特别是在这个智能的时代。当代企业针对搜索提出语义搜索,也就是根据文字的语义来进行搜索,而不是简单的词汇匹配。另外,我们也需要针对其它的数据类型,比如图片,语音及视频来进行搜索。Elasticsearch 自 8.0 开始提供向量搜索(密集向量,稀疏向量)。它可以完美地解决文字语义搜索及多媒体数据的搜索。此外,向量搜索也并非完美,特别是针对文字搜索。我们可以使用混合搜索(词汇搜索,向量搜索)进行多路召回并对最终结果进行排名,这种方法可以提高搜索的精度及召回率。在人工智能发展的今天,结合大模型,使用 GenAI 可以让我们得到唯一的搜索答案,而不是传统的搜索引擎提供的多页面的搜索结果。由于企业数据或私有数据在每时每刻都在生成。大模型在缺乏上下文的情况下使用大模型来进行推理,在很多的时候会产生幻觉,因为这些知识不存在于大模型中。结合 Elasticsearch 的向量搜索技术针对企业数据或私有数据进行搜索,把搜索结果作为上下文提供给大模型,从而消除幻觉。这种技术也被称作为 RAG(检索增强生成)。本次演讲将详细介绍 Elasticsearch 的向量搜索技术及如何使用它进行 RAG 的应用开发。
演讲提纲
1. 智能时代的搜索需求
对语义搜索的需求,而不是简单的词汇匹配
对多媒体数据的搜索,比如图片,声音及视频
非结构化数据的搜索
向量搜索带来的新的解决方案
2. Elasticsearch 向量搜索
向量搜索原理
向量搜索种类(密集向量,稀疏向量)
混合搜索介绍(多路召回,综合评分)
3. RAG 实现
如何使得大模型变得更聪明
RAG 的实现方法
4. Elasticsearch 在向量搜索上的最新进展
硬件加速
并行化
标量量化
搜索效率
重新排名
Semantic text 字段
推理 API
AI 生态
5. 使用 Elasticsearch 在企业搜索中的案例分享
高级 RAG 案例分享
您认为,这样的技术在实践过程中有哪些痛点?
向量搜索需要大量的内存及计算能力,如果针对超大规模的数据进行向量搜索,存在成本上考虑。有时搜索的结果缺乏可解释性。如何结合传统的词汇搜索来实现更加精准的搜索的结果。如何使用大语言模型/人工智能来提高最终的搜索结果排名。在使用 GenAI 时,如何针对私有或者企业数据来规避幻觉。
演讲亮点
使用 Elasticsearch 来针对企业进行大规模的商用、规避搜索幻觉
结合大模型,使用混合搜索来得到更加精准的搜索结果
听众收益
了解如何运行 Elasticsearch 来进行语义搜索
了解如何结合大模型,针对企业数据进行 GenAI 搜索
参与方式
请前往活动网站报名——QCon北京2025_全球软件开发大会暨智能软件开发生态展_InfoQ技术大会
1、本活动具体服务及内容由主办方【Elastic 中国官方活动号】提供,活动行仅提供票务技术支持,请仔细阅读活动内容后参与。
2、如在活动参与过程中遇到问题或纠纷,双方应友好协商沟通,也可联络活动行进行协助。
Elastic 是一家专注搜索的企业。作为 Elastic Stack(Elasticsearch、Kibana、Beats 和 Logstash)的开发者,Elastic 构建了自管理型和 SaaS 型产品,这些产品能够使人们在应用搜索、站点搜索、企业搜索、日志、APM、指标、安全,商业分析等用例中大规模地实时使用数据。全球范围内有数以千计的公司/组织使用 Elastic 来为任务关键型系统提供支持,这些公司/组织包括思科、eBay、高盛、微软、Mayo 医学中心等。Elastic 于2018年在中国也成立了独资公司 “弹性搜索(北京)信息技术有限公司”。 更多开发详情请参见 https://elasticstack.blog.csdn.net/。