Oracle Database 23ai新特性:AI向量搜索
Oracle AI向量搜索(AI Vector Search)是在Oracle Database 23ai中提供的一种新功能,它除了支持数据库传统上的属性值或关键字等数据值搜索之外,允许用户基于数据的语义或含义进行搜索。向量或向量嵌入是人工智能应用中使用的一种流行的数据结构。向量是由深度学习模型根据不同数据类型(例如图像、文档、视频等)生成的数字列表,用于对数据的语义进行编码。借助Oracle AI向量搜索,可以充分利用 SQL 的强大功能来生成、存储、索引和查询向量嵌入以及其他业务数据。在搜索文档时,向量搜索通常比基于关键字的搜索更有效,因为向量搜索基于单词背后的含义和上下文,而不是单词本身。Oracle AI向量搜索允许将语义文档搜索与结构化文档属性的搜索结合起来。例如,在技术文章数据库中,诸如“查找有关为企业微调大型语言模型(LLM)案例的文章,这些文章在过去 5 年中由某个作者和某个出版商在某些国家/地区出版”,需要搜索文章文本以及文章属性,这些属性可能存在于一个或多个表中。Oracle AI向量搜索的技术架构:
Oracle AI向量搜索包括一组强大的功能,以支持业务应用场景的语义搜索。这些功能包括:
新的 SQL 嵌入函数可从非结构化数据生成向量嵌入(可以调用外部向量嵌入服务,也可以将向量嵌入模型加载到数据库中)
新的一级VECTOR数据类型用于存储向量
新的高性能向量索引用于快速近似搜索
新的 SQL 运算符和语法,可轻松表达业务查询中的相似性搜索
- 支持完整的生成式AI管道,包括预处理和向量化数据,以及使用业务数据增强LLM