AI - 第9页 - 网站分类

Transformers 框架 Pipeline 任务详解（四）：问答（question-answering）

本文深入介绍了 Transformers 框架中的 question-answering 任务，涵盖任务简介、应用场景如智能助手和客户服务、任务配置与模型选择、实战代码示例，以及如何利用 Gradio 创建 WebUI 界面，使用户能通过浏览器实时获取问答结果。文章旨在帮助读者快速掌握使用 Tran... ...

AlphaStar中间LSTM Core层的核心问题

回答来自Claude3.5 详细AlphaStar介绍见原论文以、《EasyRL：强化学习教程》、 https://zhuanlan.zhihu.com/p/584951316 告诉我这段lstm网络结构的详细逻辑让我仔细思考这个LSTM网络结构的逻辑... 首先,我需要理清楚整个数据流向: - ...

rasa 实现简易的多轮对话

本文主要制作了简易的多轮对话，包括场景描述，需求分析以及实现的设计，会涉及 nlu、rules、stories、domain、config、endpoints，其中 rules 最后没用，主要用到 menmories Policy 和 TED Policy,menmories Policy在使用过程... ...

不错的AI项目集合

最近收集了一些不错的AI项目。 AutoGPT：AutoGPT 的愿景是让每个人都可以使用和构建无障碍 AI。我们的使命是提供工具，以便您可以专注于重要的事情。 Stable Diffusion web UI：图片生成工具，Stable Diffusion web UI。 langchain：构建上 ...

团队小规模本地大模型服务平台搭建 - Windows

实现目标和考虑因素部署一个支持多用户同时使用、多模型运行的离线局域网大模型服务器需要考虑以下几个关键因素：大模型的加载和管理。使用一个基础大模型，根据需要创建多个专用模型，模型管理方便可靠。并发用户和请求管理。设置管理员、用户角色，用户管理方便可靠，支持多名用户同时在线操作。多模型同时运行 ...

AI换脸小白版Max-安装使用教程分享

AI换脸的原理是利用神经网络算法对输入的人脸进行重新编码深度学习再解码输出，通过不断的学习来达到换脸的效果。 AI换脸目前在跨境电商，影视短剧，证件艺术照行业有着广泛的应用；在不同国家和地区，通过人物面孔替换，以符合当地文化审美习惯，从而更好的与当地接轨。 AI换脸小白版Max是属于操作比较简单的A ...

论文解读《The Philosopher’s Stone: Trojaning Plugins of Large Language Models》

发表时间：2025 期刊会议：Network and Distributed System Security (NDSS) Symposium 论文单位：Shanghai Jiao Tong University 论文作者：Tian Dong, Minhui Xue, Guoxing Chen, R ...

GraphRAG+文档结构：打造高性能实体溯源方案

GraphRAG通过引入文档结构信息和知识抽取流程优化，提升了知识图谱的构建和检索性能，特别是在金融、医疗等对数据完整度要求高的领域，实现了更准确的知识表示和高效的多维检索。 ...

Serverless不香了？深扒其背后的巨大骗局！

Serverless解决方案正逐渐回归到服务器上。我最近在《Serverless悼词》（A Eulogy For Serverless）一文中讨论了这个问题。这篇文章的最初想法是我对另一篇关于微服务的文章的更新。但后来我开始写这篇文章时，就有了一些创意。最终的结果就是这篇观点多于事实的文章。我还以 ...

掌握PageRank算法核心！你离Google优化高手只差一步！

0 前言 98年前的搜索引擎体验不好：返回结果质量不高：搜索结果不考虑网页质量，而通过时间顺序检索易被钻空：搜索引擎基于检索词检索，页面中检索词出现的频次越高，匹配度越高，这样就会出现网页作弊的情况。有些网页为了增加搜索引擎的排名，故意增加某个检索词频率当时Google拉里·佩奇提出PageR ...

Datawhale 2025冬令营第二弹！！自己微调模型！

Datawhale AI冬令营（第一期）垂类大模型构建定制垂类大模型 = 优质数据集 + 开源大模型整理者：博客园-岁月月宝贝！！！姓名：HeYang 特别鸣谢Datawhale!!!：https://www.datawhale.cn/activity/110/21/82?rankingPa ...

最强分类器调优秘诀！AdaBoost让性能飙升！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！作者简介：魔都架构师，多家大厂后端一线研发经验，在分布式系统设计、数据平台架构和AI应用开发等领域都有丰富实践经验。各大技术社区头部专家博主。具有丰富的引领团队经验，深厚业务架构和解决方案的积累。负责：中央/分销预订系统性能 ...

深度学习入门笔记——神经网络的构建和使用

神经网络的整体构建神经网络的基本骨架首先可以在Pytorch官网的Python API中查看torch.nn的使用，如下所示。可以看到神经网络包括Container（基本骨架）、卷积层、池化层、Padding层、非线性激活等等。构建一个神经网络首先要先构建起基本骨架，也就是Containers ...

AI辅助按UI图逆向生成软件工程

背景生成功能描述生成功能清单表格生成Use caseC端前台用例后台用例架构设计架构图软件系统架构设计的一页纸文档生成4+1软件架构视图逻辑视图物理视图开发视图运行视图生成WBS生成类图生成数据库E-R图生成时序图数据库设计DDL生成JAVA对象代码生成前端代码生成测试点生成测试用例表格完整test ...

为了改一行代码，我花了10多天时间，让性能提升了40多倍---Pascal架构GPU在vllm下的模型推理优化

ChatGPT生成的文章摘要这篇博客记录了作者在家中使用Pascal显卡运行大型模型时遇到的挑战和解决方案。随着本地大型模型性能的提升，作者选择使用vllm库进行推理。然而，作者遇到了多个技术难题，需要自行编译vllm和PyTorch，以支持Pascal架构的显卡。编译过程中，作者深入研究了显卡不 ...

解密prompt系列44. RAG探索模式？深度思考模式？

前一阵多步RAG的风吹入了工业界，kimi推出了探索版本，各应用都推出了深度搜索，You.COM更是早就有了Genius的多步模式。其实都是类似multi-hop RAG的实现 ...

深入解析 Transformers 框架（五）：嵌入（Embedding）机制和 Word2Vec 词嵌入模型实战

本文深入探讨了 Transformers 框架中词嵌入（Token Embeddings）的关键作用和实现细节，展示了将离散符号映射至连续向量空间的过程。通过具体代码示例，我们揭示了 Qwen2.5-1.5B 大模型中嵌入矩阵的工作原理，并演示了如何将文本序列转换为嵌入向量。此外，文章还介绍了经典的... ...

万众瞩目！这里开“展”！

12月3日，“AI赋能共筑数字新生态”2024数字科技生态大会在广州开幕。大会期间，天翼云围绕“国云注智·聚力向新”，聚焦“智算云”“信创云”“公有云”三大主题，进行了40余项能力成果展示，为观众带来一场沉浸式的科技盛宴。 ...

圆梦：借助云开发 CloudBase实现你的游戏开发梦想

最近我发现AI产品在不断涌现新动向，尤其是一些技术巨头推出的创新产品。例如，今天我们要探讨的是腾讯云开发的云开发 CloudBase，如果你之前没有听说过这个名字，那可能还记得腾讯云推出的另一个产品——微搭。没错，CloudBase 就是那个将AI能力融入其中的微搭平台，它能帮助用户更高效、更便捷地 ...

【1212更新】腾讯混元Hunyuan3D-1文/图生3D模型云端镜像一键运行

资源导航首页项目地址 https://github.com/Tencent/Hunyuan3D-1 腾讯混元 3D 生成模型,支持文本和图像条件生成(对于文生3D，支持中/英双语生成) 为了解决现有的3D生成模型在生成速度和泛化能力上存在不足，我们开源了混元3D-1.0模型，可以帮助3D创作者和艺 ...