模型_搜你所想

【第5章：深度生成模型— 5.1 变分自编码器（VAE）与生成对抗网络（GAN）的基础理论】

在深度学习的神奇世界里，生成模型就像是一群能创造新数据的魔法师，其中变分自编码器（VAE）和生成对抗网络（GAN）绝对是两颗耀眼的明星。今天，咱们就深入聊聊这两位“大神”，看看它们是如何在数据的宇宙里施展魔法的。变分自编码器（VAE）：潜入数据的潜在空间自编码器的进化想理解VAE，得先从自编码器说起。自编码器就像是一个数据压缩与解压的小能手。它有两个部分：编码器和解码器。编码器把输入数据“压缩...

(view)

《Transformer架构完全解析：从零开始读懂深度学习的革命性模型》

Transformer 架构是深度学习领域（尤其是自然语言处理）的革命性模型，由 Google 团队在 2017 年的论文 Attention Is All You Need 中提出。它完全基于注意力机制（Self-Attention），摒弃了传统的循环神经网络（RNN）和卷积神经网络（CNN），显著提升了模型并行计算能力和长距离依赖建模能力。以下是 Transformer 架构的完整解析：一、...

(view)

【第9章：计算机视觉实战—9.1 目标检测与识别：YOLO、Faster R-CNN等模型的实现与应用】

一、目标检测与识别：让机器看懂世界的核心技术想象一下，当你走进一家便利店，摄像头瞬间识别出你手里拿的是可口可乐还是百事可乐；自动驾驶汽车在复杂路况中精准定位行人、车辆和红绿灯——这些场景背后的核心技术就是目标检测与识别。目标检测（Object Detection）要解决三个核心问题：定位问题：找到目标在图像中的位置（用Bounding Box坐标表示）分类问题：判断检测到的目标属于什么类别 ...

(view)

Deepseek R1模型本地化部署与API实战指南：释放企业级AI生产力

摘要本文深入解析Deepseek R1开源大模型的本地化部署流程与API集成方案，涵盖从硬件选型、Docker环境搭建到模型微调及RESTful接口封装的完整企业级解决方案。通过电商评论分析和智能客服搭建等案例，展示如何将前沿AI技术转化为实际生产力。教程支持Linux/Windows双平台部署，提供15个可复现的代码片段，助力开发者在3小时内完成从零到生产的转变。关键词：Deepseek R1...

(view)

大语言模型常用微调与基于SFT微调DeepSeek R1指南

概述大型语言模型（LLM，Large Language Model）的微调（Fine-tuning）是指在一个预训练模型的基础上，使用特定领域或任务的数据对模型进行进一步训练，以使其在该领域或任务上表现更好。微调是迁移学习的一种常见方法，能够显著提升模型在特定任务上的性能。在大型语言模型（LLM）的微调中，有几种常见的方法，包括 SFT（监督微调）、LoRA（低秩适应）、P-tuning v2 和...

(view)

ML.NET库学习009：花卉图像分类模型

文章目录 ML.NET库学习009：花卉图像分类模型进行图像分类训练的实现功能分析代码结构核心组件示例输出代码实现详细步骤说明注意事项进行图像分类预测的实现主要目的原理概述实现的主要功能主要流程步骤使用的主要函数和方法关键技术功能详细解读（1）模型加载与预测引擎创建（2）图像数据读取（3）单次预测与性能测量（4）批量预测实现步骤分步骤数据结构设计关键技术1. 数据结构与内容说明2. 样本数据清...

(view)

《AI大模型专家之路》No.2：用三个模型洞察大模型NLP的基础能力

用三个模型洞察大模型NLP的基础能力一、项目概述在这个基于AI构建AI的思维探索项目中，我们实现了一个基于BERT的中文AI助手系统。该系统集成了文本分类、命名实体识别和知识库管理等功能，深入了解本项目可以让读者充分了解AI大模型训练和推理的基本原理，该项目使用了三个基础大模型：bert-base-chinese，ckiplab/bert-base-chinese-ner``，spacy.lan...

(view)

【三.大模型实战应用篇】【2.智能学员辅导系统：与大模型的深度交互】

早上七点半，初三学生小林打开数学辅导APP，发现AI老师准确指出了他昨晚作业中三次跳步计算的坏习惯——这比他亲妈观察得还细致。这背后是一场发生在代码深处的"脑力风暴"，让我们潜入智能辅导系统与大模型深度交互的"暗室"，看看那些让教育产生化学反应的代码魔法。一、从问答机到"灵魂伴侣"的进化之路 1.1 传统问答系统的"智障"现场某教育平台后台数据显示： 52%的追问请求是因为"答非所问" 学生平均...

(view)

【大模型】大模型推理能力深度剖析：从通用模型到专业优化

大模型推理能力深度剖析：从通用模型到专业优化大模型推理能力深度剖析：从通用模型到专业优化一、通用语言模型与推理模型的区别（一）通用语言模型：多任务的“万金油”（二）推理模型：复杂任务的“专家” 二、DeepSeek 系列模型的推理能力对比（一）模型架构（二）训练方法（三）推理能力（四）性能表现三、推理模型的应用场景（一）数学建模与教育（二）代码生成与优化（三）复杂逻辑推理四、推理模型的部署优势...

(view)

字节火山引擎-大模型声音复刻，流式语音合成接口

字节火山引擎-大模型声音复刻，流式语音合成接口参考文档：火山引擎-大模型声音复刻文档官网给出的示例代码有bug，这里已经修改了创建应用声音复刻大模型页面查看应用，获取接口调用需要的参数注意调用tts接口时候需要三个参数： APP ID => 获取到对应的应用Access Token => 鉴权需要声音ID => 语音合成需要 Http流式合成音频接口示例代码 package main im...

(view)

上一页 1 2 3 4 5 6 7 8 10 下一页