语言模型_搜你所想

ollama 开源大语言模型平台

Ollama是一个开源的大语言模型平台，它允许用户在本地环境中运行、创建和共享大型语言模型。Ollama支持多种功能和特性，包括但不限于：本地部署：Ollama提供了一个类似于Docker的CLI界面，使得用户可以快速地在本地进行大语言模型的推理部署1。这意味着用户可以在自己的计算机上运行大型语言模型，而不需要依赖云服务或远程服务器。 API接口和聊天界面：Ollama提供了类似OpenAI的API接口...

(view)

从头开始构建自己的 GPT 大型语言模型

图片来源： Tatev Aslanyan 一、说明我们将使用 PyTorch 从头开始构建生成式 AI、大型语言模型——包括嵌入、位置编码、多头自注意、残差连接、层归一化，Baby GPT 是一个探索性项目，旨在逐步构建类似 GPT 的语言模型。在这个项目中，我不会太详细地解释理论，而是主要展示编码部分。该项目从一个简单的 Bigram 模型开始，并逐渐融入了 Transformer ...

(view)

欢迎 Llama 3：Meta 的新一代开源大语言模型

Maker使用 🤗 TRL在单个 GPU 上对 Llama 3 8B 进行微调的示例 Llama 3 的新进展 Llama 3 的推出标志着 Meta 基于 Llama 2 架构推出了四个新的开放型大语言模型。这些模型分为两种规模：8B 和 70B 参数，每种规模都提供预训练基础版和指令调优版。所有版本均可在各种消费级硬件上运行，并具有 8000 Token 的上下文长度。 Meta-Llama-3-8b...

(view)

LM Studio：一个桌面应用程序，旨在本地计算机上运行大型语言模型（LLM），它允许用户发现、下载并运行本地LLMs

LM Studio是一个桌面应用程序，旨在本地计算机上运行大型语言模型（LLM）。它允许用户发现、下载并运行本地LLMs，支持在Windows、Linux和Mac等PC端部署2510。LM Studio的安装过程涉及访问其官网并选择相应操作系统的版本进行下载安装。安装成功后，用户可以通过该软件选择并运行心仪的模型，这些模型一般在huggingface上找到，重要因素包括模型的大小或参数量910。LM St...

(view)

LangChain：大型语言模型（LLMs）-- 基础知识

1、LangChain的调用大型语言模型模块的介绍 LangChain是一个强大的框架，旨在通过调用大型语言模型（LLM）来开发各种语言驱动的应用程序。在LangChain中，LLM不仅仅是一个简单的模型调用，而是一个复杂链条中的关键部分。这个链条可能包括数据检索、模型推理、上下文感知等多个环节，共同构成了LangChain的强大功能。 LangChain对LLM的调用进行了高度抽象和优化，使得开发者可...

(view)

大语言模型LLM《提示词工程指南》学习笔记04

文章目录大语言模型LLM《提示词工程指南》学习笔记04数据生成生成代码完成函数，继续下一行生成其他有用的代码，例如创建和测试MySQL查询代码解释提示函数大语言模型LLM《提示词工程指南》学习笔记04 数据生成 LLMs具有生成连贯文本的强大能力。使用有效的提示策略可以引导模型产生更好、更一致和更真实的响应。LLMs还可以特别有用地生成数据，这对于运行各种实验和评估非常有用。例如，我们可以使用它来...

(view)

LangChain：大型语言模型（LLMs）-- ChatGLM

1. 介绍 LangChain 是一个领先的框架，用于构建由大型语言模型（LLM）驱动的应用程序。在这个框架内，ChatGLM 作为一个重要的组件，为用户提供了强大的双语（中文-英文）对话功能。ChatGLM 基于通用的语言模型（GLM）框架，拥有数十亿级别的参数，确保了其对话的流畅性和准确性。通过量化技术，用户甚至可以在消费级显卡上进行本地部署，大大降低了使用门槛。随着技术的不断进步，ChatGLM...

(view)

ChatGPT 之改变世界的革命性的语言模型

简介：ChatGPT 是一种最先进的语言模型，改变了人类与技术互动的方式。在本书中，我们探讨了 ChatGPT 从一个小型项目发展到如今成为全球现象的历史。通过与 ChatGPT 的创造者和开发者以及受到该技术影响的人们的访谈，我们深入了解了这种语言模型如何革新各个领域。我们了解到 ChatGPT 如何提高了自然语言处理的准确性，使得机器能够以前所未有的水平理解人类语言。我们探讨了 ChatGPT ...

(view)

微软&卡内基梅隆大学：无外部干预，GPT4等大语言模型难以自主探索

强化学习中的探索能力探究在强化学习和决策制定的核心能力中，探索（exploration）扮演着至关重要的角色。探索能力指的是智能体为了评估不同选择并减少不确定性而有意识地收集信息的能力。近年来，大型语言模型（Large Language Models，简称LLMs）在多种任务中展现出了令人瞩目的性能，特别是在无需训练干预的情况下，通过上下文学习（in-context learning）来解决问题。然而，...

(view)

大语言模型LLM《提示词工程指南》学习笔记02

文章目录大语言模型LLM《提示词工程指南》学习笔记02设计提示时需要记住的一些技巧零样本提示少样本提示链式思考（CoT）提示自我一致性生成知识提示大语言模型LLM《提示词工程指南》学习笔记02 设计提示时需要记住的一些技巧指令您可以使用命令来指示模型执行各种简单任务，例如“写入”、“分类”、“总结”、“翻译”、“排序”等，从而为各种简单任务设计有效的提示。具体性对您希望模型执行的指令和任务非...

(view)

上一页 1 3 4 5 6 7 8 9 10 下一页