标签专题

LLM

这里聚合了带有“LLM”标签的内容，适合沿着一个关键词或方法脉络继续看下去。

已发布文章

首页

知识汇集

干货分享

需要处理 ClaudeCode 或 GPT 充值需求？

ClaudeCode、GPT 充值/代充、团队采购和长期需求，进入对应咨询页提交信息。

当前不配置自动支付，价格、地区和到账安排统一人工确认。

ClaudeCode 充值咨询 GPT 充值咨询

本教程介绍了如何在 Sealos 平台上快速部署 FastGPT，从架构、配置到访问和管理的一键部署指南。Sealos 提供新加坡区和北京区两种部署选项，无需购买服务器或配置域名，即可享受高并发、动态伸缩的 AI 应用服务。通过本教程，用户可在 5 分钟内完成 FastGPT 部署，实现灵活的模型管理、自定义配置和资源节省，适合快速搭建和部署本地化的 AI Agent 服务。

Prompts

LLM

在AI图像生成领域，Flux、SD1.5和SDXL是三种广泛使用的模型，每个模型都有其独特的优势和适用场景。Flux模型在生成具有细致结构的图像（如人物肖像、面部特征等）方面表现出色，但容易出现过拟合问题，调节空间相对较小。相比之下，SD1.5和SDXL更擅长生成风格化和抽象的图像，适用于艺术创作和概念设计等领域。本文深入分析了这三种模型的架构差异和生成效果，帮助用户根据实际需求选择最合适的工具。同时，提供了一个快速体验入口，供读者亲自试用这些先进的AI图像生成模型。

LLM

Research

Vercel v0 平台让开发者只需几分钟便可通过自然语言构建3D游戏、交互应用等。支持自动部署与托管，提升了开发和分享效率。MLE-Agent 则是 AI 工程智能助手，适合复杂任务管理；Command R+ 提供 RAG 优化，自动化多步骤任务。结合 v0、MLE-Agent 和 Command R+，开发者可以更高效地构建、优化并管理多样化的AI应用。

LLM

Automation

ElevenLabs 发布全新 AI 语音生成工具 Voice Design：通过文本提示创建个性化语音

ElevenLabs 推出新 AI 语音生成工具 Voice Design，通过简单的文本提示即可生成个性化语音。用户可自定义语音的年龄、口音、性别、语调等特征，还能创建具有神话或科幻角色特征的声音，广泛适用于广告、游戏、播客等场景。工具支持语音微调功能，并与 ElevenLabs 的文本转语音平台无缝整合，未来还将提供 API 支持和实时语音生成功能。

LLM

Digital-Human

Zotero GPT 是学术研究利器，特别是在文献阅读方面。配合 EasyPDF.ai 和 GPT 4.0，您可以快速理解文献，配置免费API密钥后即可使用，不受网络限制，快速入手AI辅助的文献管理工具。以下是配置和使用步骤：

Tutorials

LLM

Research

PaperQA2 是一款超越人类专家的开源科学文献检索AI工具，由 Future House 开发。它支持多任务处理，包括文献查找、信息提取和引用网络分析。通过使用 LitQA2 测试集，PaperQA2 在科学文献检索上表现优异，超越博士和博士后级别的研究人员。此外，基于 PaperQA2 的 WikiCrow 能够生成准确度超过维基百科的科学总结。另一模块 ContraCrow 则用于分析文献矛盾，帮助生成新假设。PaperQA2 开创了科学文献交互的新方式，为科研工作者提供了高效的文献分析工具。

LLM

Research

GOT-OCR 2.0 是一款开源的端到端 OCR 工具，具备5.8亿参数，支持多任务处理，包括自然场景文本识别、手写识别和表格检测。该模型支持本地部署与在线使用，灵活适应多种应用场景，如文档数字化、自然场景识别和多语言文本分析。凭借其模块化设计和高精度识别，GOT-OCR 2.0 为独立开发者和企业提供了高效、便捷的文字识别解决方案。

Tutorials

LLM

Automation

17岁高中生 Zach 通过开发的体重管理应用 Cal AI，在4个月内实现了百万美元收入。Cal AI 利用图像识别分析食物热量，帮助用户进行科学的体重管理。该应用的成功归功于解决了真实需求，并采用创新的社交媒体传播策略。团队成员之一 Brake 自学 AI 编程，总结出通过发现需求、低成本传播和快速验证实现增长的策略。Cal AI 的成功标志着“快应用”风潮的崛起，即独立开发者通过单一功能应用迅速验证市场需求并盈利。这一案例为AI独立开发者展示了市场机会，同时也揭示了成功所需的敏锐市场洞察与有效的推广策略。

LLM

Popular

智谱 AI 推出全球领先智能体 AutoGLM：一句话即可完成手机操作，全面解放双手

智谱 AI 于近日发布了其最新智能体 AutoGLM，实现了“一句话搞定手机操作”的便捷体验。用户只需通过语音输入需求，AutoGLM 即可在手机或网页上自动执行各类复杂任务，如点外卖、订酒店、购物等。AutoGLM 的核心技术包括任务规划与动作执行的解耦设计、自我学习框架等，使其操作更加精确、灵活，逐步提升任务完成率。同时，智谱 AI 还发布了情感语音模型 GLM-4-Voice，具备多情感表达、灵活输出和多语言支持，带来自然流畅的互动体验。这两项创新为用户提供了全新的智能生活方式。

LLM

Research

Popular

Deepgram推出的AI语音代理API实现了流畅的实时语音对话。通过先进的语音识别和生成模型，该API支持实时对话、停顿和中断处理，且可灵活集成不同的大语言模型。其低延迟和强隐私保护适合客户支持、医疗转录等场景。

LLM

Digital-Human

Adobe 推出 Project Turntable：让 2D 矢量图像实现 3D 旋转并自动补充缺失部分

在 Adobe MAX 2024 大会上，Adobe 发布了创新 AI 工具 Project Turntable，让用户能够将 2D 矢量图像像 3D 对象一样旋转，同时利用生成式 AI 补充旋转过程中暴露的图像缺失部分。该工具简化了以往需手动重绘视角的操作流程，使设计师只需简单拖动滑块，即可实现图像的 3D 旋转效果，保持图像一致性并节省大量时间。Project Turntable 目前处于早期开发阶段，有望成为 Adobe Illustrator 等设计工具中的标准功能。

LLM

@MKBHD 在最新视频中介绍了如何组建团队，提升视频质量，并通过“章鱼”的比喻说明团队协作的重要性。团队分工让每个成员专注于自己的领域，优化各个制作环节：脚本写作、灯光设计、视频剪辑、缩略图设计、音频处理等。创作者需要专注于三颗心脏象征的核心任务：上镜、评测产品和编辑决策，确保视频方向与个人风格一致。

LLM

上页

1 2 3

上页