标签:llm

技术译文 | Google 在 MySQL 中推进矢量搜索,在 LLM 支持方面超越 Oracle

技术译文 | Google 在 MySQL 中推进矢量搜索,在 LLM 支持方面超越 Oracle

谷歌已将向量搜索引入其 MySQL 数据库服务,这一步领先了 MySQL 的所属公司 Oracle,迄今为止,Oracle 尚未给 MySQL 添加任何大型语言模型(LLM)方面的功能。 谷歌云数据库副总裁安迪·古特曼斯 (Andi Gutmans) 表示,在过去 12 年里,谷歌在向量方面的创新速

向阳逐梦 向阳逐梦 2024-03-12
0 0 0
构建本地运行的LLM语音助理

构建本地运行的LLM语音助理

译者 | 朱先忠审校 | 重楼引言我不得不承认,我最初对大型语言模型(LLM)生成实际有效的代码片段的能力持怀疑态度。我抱着最坏的打算尝试了一下,结果我感到很惊喜。就像与聊天机器人的任何互动一样,问题的格式很重要;但随着时间的推移,你会知道如何指定你需要帮助的问题的边界。当我的老板发布了一项全公司范

向阳逐梦 向阳逐梦 2024-03-12
0 0 0
专为企业级大模型开发的框架、工具和模型

专为企业级大模型开发的框架、工具和模型

背景介绍在当今的企业环境下,很多的公司都在落地大模型相关的应用。但是并不是每个公司都具备相应的专业大模型的人才,能够很好的处理大模型落地过程中碰到的问题。今天要给大家推荐一个 GitHub 开源项目 llmware-ai/llmware,该项目在 GitHub 有超过 1.6k Star,用一句话介

大树 大树 2024-03-11
0 0 0
​有了LLM,所有程序员都将转变为架构师?

​有了LLM,所有程序员都将转变为架构师?

编译 | 言征  出品 | 51CTO技术栈(微信号:blog51cto)生成式人工智能是否会取代人类程序员?可能不会。但使用生成式人工智能的人类可能会,可惜的是,现在还不是时候。目前,我们正在见证LLM领域的激烈竞争。仅仅是谷歌的生成式人工智能产品就已经变得非常丰富——其最新的开放模型Gemma就

醒在深海的猫 醒在深海的猫 2024-03-06
0 0 0
2024 年 AI 辅助研发趋势:从研发数字化到 AI + 开发工具 2.0,不止于 Copilot

2024 年 AI 辅助研发趋势:从研发数字化到 AI + 开发工具 2.0,不止于 Copilot

在上一年里,已经有不少的企业在工具链上落地了生成式 AI,结合我们对于这些企业的分析,以及最近在国内的一些 “新技术” 趋势,诸如于鸿蒙原生应用的初步兴起。从这些案例与趋势中,我们也看到了一些新的可能方向。结合我们在 LLM as-Copilot,LLM as-Integrator,LLM as-F

醒在深海的猫 醒在深海的猫 2024-03-05
0 0 0
无需GPU,轻松搭建本地大语言模型(LLM)服务:OpenAI接口与C#/Python实现

无需GPU,轻松搭建本地大语言模型(LLM)服务:OpenAI接口与C#/Python实现

一、引言随着自然语言处理(NLP)技术的快速发展,大语言模型(LLM)成为了研究和应用的热点。然而,搭建LLM服务通常需要高性能的GPU资源,这对于个人开发者和小型企业来说可能是一个挑战。本文旨在提供一种无需GPU的LLM服务搭建方案,并通过OpenAI的接口标准,使得开发者能够轻松集成和使用LLM

LOVEHL^ˇ^ LOVEHL^ˇ^ 2024-03-05
0 0 0
开源日报 | 我让 AI 用 C 语言写一个算法;微软三进制 LLM

开源日报 | 我让 AI 用 C 语言写一个算法;微软三进制 LLM

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。 # 2024.2.29 今日要点 OpenSource Daily 阿里发布肖像视频生成框架 EMO 来自阿里巴巴的团队发布了音频驱动的肖像视频生成框架 EMO(Emote Portrait Alive),相关论文同步发表于

大白菜程序猿 大白菜程序猿 2024-03-02
0 0 0
语言大模型的浮点运算分配

语言大模型的浮点运算分配

本文通过实证分析展示了实际LLM模型的FLOPS分配情况,并与理论分析进行对比。通过理论和实证相结合的方式,本文为理解和优化语言大模型的性能提供了有益见解。   作者Finbarr Timbers是一名机器学习研究员,曾就职于DeepMind。(以下内容由OneFlow编译发布,转载请联系授

三掌柜 三掌柜 2024-02-29
0 0 0
LangChain原理学习笔记

LangChain原理学习笔记

最新越发觉得AI的发展,对未来是一场革命,LangChain已经在工程设计上有了最佳实践,类似于AI时代的编程模型或编程框架,有点Spring框架的意思。之前在LangChain上也有些最佳实践,所以在这里分享记录下。 La

贤蛋大眼萌 贤蛋大眼萌 2024-02-27
0 0 0
LangChain 完成 2500 万美元 A 轮融资,正式发布 LLMOps 产品 LangSmith

LangChain 完成 2500 万美元 A 轮融资,正式发布 LLMOps 产品 LangSmith

LangChain 是用于构建 LLM 应用的开源工具,近日其开发商宣布完成了由红杉资本领投的 2500 万美元 A 轮融资,并正式推出首款付费 LLMOps 产品 LangSmith。 https://twitter.com/LangChainAI/status/1758169569364

剑圣无痕 剑圣无痕 2024-02-19
0 0 0
揭开向量索引概念的神秘面纱

揭开向量索引概念的神秘面纱

自从ChatGPT公开发布以来,人们几乎没有一天不讨论LLM(大型语言模型)、RAG(检索增强生成:Retrieval Augmented Generation)和向量数据库的新内容。技术世界充斥着LLM的可能性,LLM被视为将改变我们生活的最新技术:对一些人来说是最好的,对另一些人来说则是最坏的。

爱可生开源社区 爱可生开源社区 2024-02-14
0 0 0
容器下在 Triton Server 中使用 TensorRTLLM 进行推理

容器下在 Triton Server 中使用 TensorRTLLM 进行推理

1. TensorRT-LLM 编译模型1.1 TensorRT-LLM 简介使用 TensorRT 时,通常需要将模型转换为 ONNX 格式,再将 ONNX 转换为 TensorRT 格式,然后在 TensorRT、Triton Server 中进行推理。但这个转换过程并不简单,经常会遇到各种报错

LOVEHL^ˇ^ LOVEHL^ˇ^ 2024-02-04
0 0 0
大语言模型推理提速:TensorRTLLM 高性能推理实践

大语言模型推理提速:TensorRTLLM 高性能推理实践

作者:顾静 TensorRT-LLM 如何提升 LLM 模型推理效率 大型语言模型(Large language models,LLM)是基于大量数据进行预训练的超大型深度学习模型。底层转换器是一组神经网络,这些神经网络由具有 self-attention 的编码器和解码器组成。编码器和解码器从一系

向阳逐梦 向阳逐梦 2024-01-24
0 0 0
火山引擎ByteHouse:“专用向量数据库”与“数据库+向量扩展”,怎么选?

火山引擎ByteHouse:“专用向量数据库”与“数据库+向量扩展”,怎么选?

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 背景 随着LLM(Large Language Model)的不断发展,向量检索也逐渐成为关注的焦点。LLM通过处理大量的文本数据,获取丰富的语义信息,从而能够更好地理解和生成自然语言。然而,LLM的输出通常是一

剑圣无痕 剑圣无痕 2024-01-23
0 0 0
性能持续突破!火山引擎ByteHouse上线向量检索能力

性能持续突破!火山引擎ByteHouse上线向量检索能力

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 随着LLM技术应用及落地,数据库需要提高向量分析以及AI支持能力,向量数据库及向量检索等能力“异军突起”,迎来业界持续不断关注。简单来说,向量检索技术以及向量数据库能为 LLM 提供外置的记忆单元,通过提供与问题

泡泡 泡泡 2024-01-10
0 0 0
《2023 中国开源开发者报告》正式发布

《2023 中国开源开发者报告》正式发布

《2023 中国开源开发者报告》正式发布。 此报告由开源中国与 Gitee 发布,整体分为三章,分别是: 第一章《开源开发者事件回顾》 第二章《2023 LLM 技术报告》 第三章《<Gitee × OSS Compass> Insight:中国开发者开源

法医 法医 2023-12-29
0 0 0
2024年人工智能工程的五大趋势

2024年人工智能工程的五大趋势

导读:各位,2024年将是LLM之年,所有的应用程序都要加入AI与LLM。有激情的你准备好了吗?各位开发者,各位朋友,可以预见的是——在应用程序开发中使用大型语言模型(LLM)将是2024年技术的最大趋势之一。从2023年开始,很多公司通过其 API 连接使用 OpenAI 的专有AI模型。但是,到

泡泡 泡泡 2023-12-27
0 0 0
苹果研究将 LLM 存储在 NAND 以减少 RAM 使用

苹果研究将 LLM 存储在 NAND 以减少 RAM 使用

为了发展自家生成式 AI,苹果一直在测试大型语言模型 LLM,但苹果同时要思考的是,要如何将 LLM 塞进手机与笔记本电脑。现在有消息称,LLM 对 CPU 与记忆体资源负载太重,苹果正尝试将 LLM 放在 NAND 闪存,以实现多设备轻松存取目标。一般情况下 LLM 需要 AI 加速器与较高 DR

醒在深海的猫 醒在深海的猫 2023-12-23
0 0 0
Prompt flow
                                                                                                                            构建高质量的 LLM 应用程序

Prompt flow 构建高质量的 LLM 应用程序

Prompt flow 是一套开发工具,旨在简化基于 LLM 的人工智能应用程序的端到端开发周期,从构思、原型设计、测试、评估到生产部署和监控。它使即时工程变得更加容易,并使你能够构建具有生产质量的 LLM 应用程序。 通过该项目,你将能够: 创建将 LLM、提示、Python 代

贤蛋大眼萌 贤蛋大眼萌 2023-12-17
0 0 0
新技术 LINT 可强制 LLM 回答有毒问题

新技术 LINT 可强制 LLM 回答有毒问题

美国普渡大学(Purdue University)的研究人员发布了,一篇名为《Make Them Spill the Beans! Coercive Knowledge Extraction from (Production) LLMs》的论文。描述了他们通过利用大模型厂商倾向于公开与提示响应相关的

Escape Escape 2023-12-13
0 0 0
1 2 3 4