Chat T2¶

一个特定领域的 RAG 应用。主要面向学生/萌新研究员这样的用户群体。

这个项目代码主要是我和室友王毅涵写的，我只是写其中应用层的部分，他是写后端核心逻辑的（无框架裸 agent）。项目由秦志伟教授和黄家权师兄牵头。项目名字 "ChatT2" 中的 "T2" 指的是 Type II polyketide formicamycin，这是秦老师课题组的重要研究成果。还有课题组的多位师姐师兄参与，但是由于项目后来烂尾虎头蛇尾了所以大家都退群了，我怕我找不全所以就不列出了😭

Y. Wang et al. ChatT2: An adaptive framework for developing a large language model-based agent for natural product domain research. 2025, under review.

以下内容完全是 AI 填充的的，我还没校对，质量不高，谨慎参考

技术栈¶

前端架构¶

组件	技术	说明
框架	Svelte 5	使用最新的响应式语法和 `$state`
构建工具	Vite 7.x	快速构建和开发服务器
类型系统	TypeScript 5.5+	静态类型检查
UI 组件	bits-ui	模块化组件库
样式	UnoCSS	原子化 CSS 框架
Markdown 支持	marked 17.x + @humanspeak/svelte-markdown	富文本渲染
状态管理	svelte-persisted-store	本地存储持久化

后端架构¶

组件	技术	说明
框架	FastAPI 0.124+	Python 3.12 高性能 API 框架
API 设计	RESTful API	支持流式响应
AI 集成	OpenAI SDK 2.7.2	主要使用 LLM API
观测性	LangFuse 2.60	LLM 观测和分析
日志系统	LogFire 4.16	结构化日志和指标
数据处理	pandas, numpy, SQLAlchemy	数据处理和 ORM
化学信息学	RDKit	分子数据处理

核心功能¶

功能	状态	说明
流式聊天响应	✅	支持 Markdown 渲染
会话历史管理	✅	localStorage 持久化
AI 生成对话建议	✅	基于上下文智能建议
自动标题生成	✅	多语言支持
实时心跳检测	✅	服务预热机制
Docker 容器化	✅	一键部署支持

架构特点¶

前后端分离设计¶

前端静态资源通过 Vite 构建，后端提供 API 服务
使用 CORS 中间件支持跨域请求
统一的错误处理和流式响应机制

模块化后端服务¶

app/chat.py: 核心聊天逻辑，支持流式和非流式响应
app/suggest.py: 智能建议生成，使用 Promplate 模板系统
app/title.py: 自动标题生成，基于内容摘要
app/utils/: 共享工具（响应处理、API 调用等）

开发体验优化¶

使用 Ruff 进行代码格式化和检查
支持热重载开发模式
完整的 TypeScript 类型支持

部署与扩展¶

项目采用多阶段 Docker 构建：

JS 构建阶段: 使用 Bun 安装依赖，Vite 构建前端
Git 阶段: 拉取 HuggingFace 数据集子模块（chatt2）
Python 阶段: 安装依赖和虚拟环境
生产阶段: 组合所有组件，使用 Uvicorn 启动服务

容器暴露 9040 端口，支持水平扩展和容器编排。

与相关项目的关系¶

演进路径: 相比 free-chat，ChatT2-v1 采用了更现代的技术栈（Svelte 5、FastAPI）
功能增强: 不仅提供基础聊天功能，还集成了 AI 辅助功能（建议生成、标题生成）
观测性: 集成了专业的 LLM 观测工具（LangFuse），便于调试和优化
子模块依赖: 包含 chatt2 数据集子模块，为模型训练或推理提供数据支持

项目采用现代 Python 项目管理实践（pyproject.toml、uv 包管理），确保依赖管理和开发环境的一致性。

项目发展时间线¶

2024 年¶

3 月 25 日: ChatT2-v1 仓库创建（Yisir-w）
3 月 26 日: chat-t2-deploy fork 创建（CNSeniorious000），部署到 Railway 平台
6 月起: 多个 dependabot 自动更新 PR，依赖持续升级
FastAPI: 0.119.0 → 0.124.0
LLM 相关依赖持续升级
Svelte 5 生态升级

2025 年¶

持续维护: 主要依赖保持在最新稳定版本
自动化: 依赖更新、安全补丁通过 dependabot 自动处理

自动化维护体系¶

项目建立了完善的自动化维护体系：

Dependabot 集成: 多个 dependabot 分支自动处理依赖升级
Python 版本升级（3.12 → 3.13 → 3.14）
FastAPI 依赖升级（0.119.0 → 0.124.0）
OpenAI SDK 持续更新（2.7.2 → 2.11.0）
Svelte 生态系统组件升级
安全补丁: 自动处理 CVE 漏洞修复
代码质量: Ruff 自动格式化和检查
发布流程: 自动化测试和部署

安全注意事项¶

⚠️ 重要: Docker 构建过程中包含硬编码的 HuggingFace 访问凭证：

RUN git config --global url."https://muspi-merol:[email protected]/".insteadOf "https://huggingface.co/"

建议在生产环境中使用环境变量或 Docker secrets 来管理敏感凭证。

深入源码分析¶

核心架构模式¶

前后端流式通信架构¶

项目采用现代的流式处理模式，实现真正的实时聊天体验：

前端流式处理 (frontend/src/lib/iter.ts)

// 核心流式响应处理
export default async function* (res: Response): AsyncGenerator<string> {
  const reader = res.body.getReader();
  const decoder = new TextDecoder();
  while (true) {
    const { done, value } = await reader.read();
    if (done) break;
    yield decoder.decode(value, { stream: true });
  }
}

// 累积缓冲区，实现增量渲染
export async function* accumulate(generator: AsyncGenerator<string>): AsyncGenerator<string> {
  let buffer = "";
  for await (const chunk of generator) {
    buffer += chunk;
    yield buffer;
  }
}

后端流式响应 (app/chat.py)
支持 PATCH 请求的流式响应
双阶段处理：embeddings 计算 → 文本生成
响应格式：JSON(embeddings)\n\nMarkdown 内容

前端实现细节¶

Svelte 5 响应式模式¶

项目充分利用 Svelte 5 的最新特性：

// 状态管理 (Chat.svelte)
let { session = $bindable(), animate = $bindable() }: Props = $props();
const title = $derived(session.title);
let messages = $state<ChatMessage[]>();
$effect(() => {
  messages = session.messages;
});

// 智能建议系统
$effect(() => {
  if (typeof window != "undefined" && !loading) {
    if (messages.length && messages[messages.length - 1].role === "assistant") {
      updateSuggestions();
    }
  }
});

模块化组件设计¶

Chat.svelte: 163 行，集成所有核心逻辑
流式响应处理
建议生成触发
标题自动生成
滚动控制
Message.svelte: 支持结构化响应解析
检测 {text_answer, reference} 格式
Markdown 渲染
引用展示
Sidebar.svelte: 会话管理 + recall rate 控制
bits-ui Slider 组件
本地存储同步
新会话创建

后端实现细节¶

模块化路由设计¶

chat.py: 核心聊天逻辑
/ask (POST): 非流式响应
/ask (PATCH): 流式响应
suggest.py: 智能建议
/suggest: 基于上下文的建议生成
/heartbeat: 健康检查和预热
title.py: 自动标题生成
/title: 多语言标题生成

数据流架构¶

三层数据流¶

用户输入 → 前端收集 (query + history + embeddings)
流式处理 → 后端计算 embeddings + 生成响应
增量渲染 → 前端累积显示 + 本地存储

状态持久化¶

localStorage: 聊天会话持久化
svelte-persisted-store: recall rate 设置持久化
自动同步：$effect(() => sync(sessions))

性能优化策略¶

前端优化
流式渲染避免大块 DOM 更新
动画延迟计算：delay: i ** 1.5 * 10
图片 URL 自动修复：patchMarkdown()
后端优化
客户端实例缓存
依赖预热（heartbeat 端点）
分阶段响应（embeddings → answer）
网络优化
增量加载（accumulate 缓冲区）
请求取消（AbortController）
CORS 优化

安全与观测性¶

LangFuse 集成¶

完整的 LLM 调用追踪
性能指标收集
错误监控和调试

模板系统¶

Promplate 模板管理
外部模板拉取：Template.fetch("https://github.com/promplate/demo/raw/main/src/templates/suggest.j2")
统一的提示词管理

这种架构设计展现了现代 Web 应用的典型模式：流式处理、响应式状态管理、模块化后端服务，以及完善的观测性支持。

深入源码架构分析¶

设计模式解析¶

1. 抽象工厂模式的巧妙运用¶

最精妙的设计在于 app/utils/complete.py：

# main 分支
from chatt2.chatnp.utils.llm_api import client

# sensor 分支
from sensor.utils.llm_api import client

@cache
def get_generate():
    from promplate.llm.openai import ChatGenerate
    from promplate_trace.langfuse import patch
    return patch.chat.generate(ChatGenerate(api_key=client.api_key))

设计巧思：

通过 不同的导入路径 实现数据源切换
统一的 get_generate() 接口，隐藏了底层实现差异
@cache 装饰器确保 LLM 客户端只初始化一次

这种设计允许 main、v2、sensor 分支共享 100% 相同的业务逻辑代码，只需替换导入路径即可切换数据源，堪称 "一稿多投"架构的精髓。

代码作者说明：

王毅涵：负责核心数据处理模块
chatt2/ 子模块：完整的化学信息学数据处理逻辑
sensor/ 子模块：传感器数据处理逻辑
本人：负责应用层代码
FastAPI 路由和业务逻辑（app/chat.py、app/suggest.py、app/title.py）
前端界面和交互逻辑
整体架构设计和集成

王毅涵核心代码架构解析¶

通过分析 sensor/ 子模块，可以看出王毅涵的代码设计哲学：实用主义 + 精细化封装。

1. LLM 客户端的极致封装 `sensor/utils/llm_api.py`¶

def get_text_completion_with_tools(
    messages,
    model="gpt-4-0125-preview",
    temperature=0.2,
    response_format: Literal["text", "json_object"] = "text",
    tools=None,
    tool_choice="auto",
):
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=temperature,
        response_format={"type": response_format},
        tools=tools,
        tool_choice=tool_choice,
    )
    return response.choices[0]

设计亮点：

多层 API 封装：提供 4 种不同的 LLM 调用方式
get_text_completion(): 基础文本生成
get_text_completion_with_tools(): 支持工具调用
get_text_completion_with_stream(): 流式响应
get_embedding(): 向量 embedding 生成
参数灵活性：通过 Literal 类型提示限制响应格式
向后兼容：try/except 处理 LangFuse OpenAI 包装器
硬编码 API key：体现了"快速验证"的产品思维

2. 流式处理的装饰器模式 `sensor/utils/stream.py`¶

这个 @streamable 装饰器

这个函数虽然出现在王毅涵的仓库中，但实际是我编写的。我对这个设计感到非常自豪，它完美地解决了"同一函数既返回结果又支持流式输出"的难题。

from __future__ import annotations

from inspect import isgeneratorfunction
from types import GeneratorType
from typing import TYPE_CHECKING, Generic, overload

if TYPE_CHECKING:
    from typing import Callable, Generator, ParamSpec, TypeVar

    P = ParamSpec("P")
    Yield = TypeVar("Yield")
    Return = TypeVar("Return")

    @overload
    def streamable(func: Callable[P, Generator[Yield, None, Return]]) -> Streamable[P, Yield, Return]: ...
    @overload
    def streamable(func: Callable[P, Return]) -> Callable[P, Return]: ...

def streamable(func):
    return Streamable(func) if isgeneratorfunction(func) else func

class Streamable(Generic[P, Yield, Return] if TYPE_CHECKING else object):
    def __init__(self, func: Callable[P, Generator[Yield, None, Return]]):
        self.stream = func

    def __call__(self, *args: P.args, **kwargs: P.kwargs) -> Return:
        it = self.stream(*args, **kwargs)

        if not isinstance(it, GeneratorType):
            return it  # type: ignore

        try:
            while True:
                next(it)
        except StopIteration as e:
            return e.value

__all__ = ["streamable"]

if __name__ == "__main__":

    @streamable
    def f():
        yield 2
        return 123

    assert f() == 123

    for i in f.stream():
        assert i == 2

    @streamable
    def g():
        return 234

    assert g() == 234

设计精髓：

同一函数双重接口：既可以普通调用获取返回值，也可以流式输出
类型安全：使用 Generic 和 ParamSpec 实现完整的类型提示
无缝转换：isgeneratorfunction 检查自动决定包装方式
生成器优化：while True 循环消耗所有生成器值
优雅降级：非生成器函数直接返回，不强制流式处理

这堪称 装饰器模式 的典范应用，将流式处理抽象为透明的装饰器。

3. 多模态检索系统 `sensor/retrieval/`¶

向量检索 `vector_retrieval.py`¶

def retrieve_vector_data(rewrited_query_embedding): #(1)!
    rewrited_query_embedding = np.array(rewrited_query_embedding)
    text_vector = pd.DataFrame(read_json(vector_database_path))
    text_vector["cosine_similarity"] = np.dot(
        np.array(text_vector["vector"].array.tolist()),
        rewrited_query_embedding
    )
    top_n_text = text_vector.nlargest(3, "cosine_similarity")
    return "\n".join(top_n_text["text"].to_list())

他写的就是 rewrited，这看来是一个 typos。不过他的 codebase 中充满了 typos 😂

算法选择：

使用 余弦相似度 而非欧氏距离（更适合高维向量）
pandas 矢量化操作 替代循环，性能优化
Top-K 检索 返回最相关的 3 个结果

图像检索 `images_retrieval.py`¶

images_xml = "<image" + str(index) + "><description>" + item["description"] + "</description><url>" + item["url"] + "</url></image" + str(index) + ">"

数据格式化巧思：

XML 标签包装：为每个图像添加索引标签，便于 LLM 引用
结构化描述：description + url 的组合，LLM 可以据此生成图片链接
前端友好：返回的 XML 可直接用于前端渲染

4. 实用工具集的设计哲学¶

文件处理 `file_read_write.py`¶

def write_json(data, file_path):
    with open(file_path, "w", encoding="utf-8") as f:
        json.dump(data, f, indent=4, ensure_ascii=False)

细节关注：

UTF-8 编码：确保中文等非 ASCII 字符正确保存
ensure_ascii=False：保留原始字符而非转义为 Unicode
统一的异常处理：所有文件操作使用相同的编码策略

格式转换 `switch_format.py`¶

def dict_to_markdown_table(view):
    data = [{col: val for col, val in zip(view.columns, row)} for row in view.values]
    # ... 生成 Markdown 表格

工具化思维：

字典 → Markdown 表格：便于前端展示
JSON 序列化/反序列化：数据交换的标准格式

5. 模块化的数据管理¶

# sensor/data/__init__.py
from pathlib import Path

root = Path(__file__) / ".."
cwd = Path.cwd()

images_catalog = (root / "images/catalog.xlsx").resolve().relative_to(cwd).as_posix()
vector_database_path = (root / "vector_database/vector.json").resolve().relative_to(cwd).as_posix()

路径管理：

相对路径计算：使用 Path 对象的链式调用
跨平台兼容：as_posix() 确保路径格式统一
动态路径：基于文件位置计算，避免硬编码

6. 依赖管理的精简策略¶

查看 sensor/pyproject.toml，王毅涵选择了 轻量级依赖：

移除 rdkit、sqlalchemy 等化学专用库
保留核心的 AI/数据处理库（pandas、numpy、openai）
一稿多投 的极致体现：同一套工具适配不同领域

代码风格总结¶

王毅涵的代码展现了以下特点：

实用主义：快速实现功能，注重验证效果
封装彻底：每个工具函数都有明确的单一职责
性能敏感：大量使用 pandas/numpy 的矢量化操作
格式友好：输出格式直接适配前端或 LLM
类型安全：Python 类型提示贯穿始终

这种代码风格非常适合 研究导向的快速原型开发，既保证了功能实现，又保持了代码的可读性和可维护性。

2. 缓存策略的多层设计¶

项目在多个层面使用了缓存：

# 1. LLM 客户端缓存（避免重复初始化）
@cache
def get_generate():
    return patch.chat.generate(ChatGenerate(api_key=client.api_key))

# 2. 模板缓存（避免重复网络请求）
@cache
def get_prompt():
    return Template.fetch("https://github.com/promplate/demo/raw/main/src/templates/suggest.j2")

性能优化：

LLM 客户端是重量级对象，缓存避免重复创建
模板文件可能来自网络，缓存减少延迟
函数级缓存简单高效，无需额外状态管理

3. 响应式流处理模式¶

class StreamingJSONResponse(StreamingResponse):
    def __new__(cls, *args, **kwargs):
        return partial(StreamingResponse, media_type="application/json")(*args, **kwargs)

设计亮点：

继承 StreamingResponse 但简化使用
通过 __new__ 方法实现 静态工厂模式
统一了 JSON 流式响应的媒体类型设置

4. 预热机制的服务化设计¶

@router.post("/heartbeat")
def warm_up(bg: BackgroundTasks):
    bg.add_task(get_prompt)
    bg.add_task(lambda: list(map(print, get_generate()("hello", model="gpt-4o-mini", max_completion_tokens=1))))
    return "healthy"

架构价值：

使用 BackgroundTasks 避免阻塞主请求
主动预热：在用户请求前就准备好资源
双重预热：模板缓存 + LLM 客户端初始化
确保首次请求也有良好性能

5. 模板系统的外部化管理¶

@cache
def get_prompt():
    return Template.fetch("https://github.com/promplate/demo/raw/main/src/templates/suggest.j2")

灵活性设计：

模板存放在 GitHub 远程仓库
无需重新部署即可修改提示词
支持版本控制和协作编辑
缓存机制平衡了灵活性与性能

模块化架构的层次结构¶

app/
├── main.py           # 应用入口，FastAPI 实例组装
├── chat.py           # 核心聊天逻辑
├── suggest.py        # 智能建议（三个分支代码相同）
├── title.py          # 标题生成（三个分支代码相同）
├── static.py         # 静态文件服务
└── utils/
    ├── complete.py   # LLM 客户端（仅导入路径不同）
    └── response.py   # 响应处理工具

架构优势：

高度模块化：每个模块职责单一
代码复用：三个分支共享 95% 代码
易于测试：每个模块可独立测试
便于维护：修改影响范围可控

代码归属：

应用层模块（本人编写）：
app/main.py、app/chat.py、app/suggest.py、app/title.py
app/static.py、app/utils/response.py
数据处理层（王毅涵编写）：
chatt2/：化学信息学核心算法
sensor/：传感器数据处理逻辑

跨分支的数据流架构¶

数据流向清晰展现了 松耦合 的设计理念：

流程路径：

用户请求 → FastAPI 路由系统
路由分发 → 业务模块（chat.py / suggest.py / title.py）
业务逻辑 → 调用 get_generate() 获取 LLM 客户端
客户端工厂 → 根据分支选择不同数据源：
main/v2 分支：chatt2.chatnp.utils.llm_api.client
sensor 分支：sensor.utils.llm_api.client
数据处理 → 调用相应数据集进行推理

关键设计决策：

依赖倒置：业务代码不直接依赖数据源
策略模式：通过不同客户端实现不同策略
延迟绑定：运行时确定使用哪个数据源
统一接口：get_generate() 隐藏了数据源差异

错误处理和观测性¶

项目集成了 LangFuse 进行观测：

from promplate_trace.langfuse import patch

return patch.chat.generate(ChatGenerate(api_key=client.api_key))

观测性设计：

通过 patch 方式无侵入式集成监控
自动追踪 LLM 调用、性能指标
支持分布式链路追踪
为调试和优化提供数据支撑

性能优化的精细化设计¶

客户端实例缓存：避免重复创建昂贵的 LLM 客户端
模板预加载：heartbeat 端点主动预热
流式响应：减少用户等待时间
异步处理：BackgroundTasks 不阻塞主流程
依赖优化：按需导入，减少启动时间

这种架构设计完美平衡了 代码复用性、性能表现、可维护性和扩展性，是现代 Python Web 应用的优秀范例。

分支	项目定位	核心依赖	主要功能	数据集版本
`main`	formicamycin 研究专用版	完整化学信息学栈	基础聊天 + 化学分析	`67fe2b0`
`v2`	formicamycin 研究增强版	基础 + 生物信息学工具	批量处理 + 序列分析	`71f4497e`
`sensor`	通用传感器数据 RAG	轻量级依赖	简化聊天 + 传感器分析	独立数据集

分支	commit hash	Docker 引用方式	版本特征
main	`67fe2b0`	`git checkout 67fe2b0c...`	较早稳定版
v2	`71f4497e`	`git checkout 71f4497e...`	功能增强版

Chat T2¶

技术栈¶

前端架构¶

后端架构¶

核心功能¶

架构特点¶

前后端分离设计¶

模块化后端服务¶

开发体验优化¶

部署与扩展¶

与相关项目的关系¶

项目发展时间线¶

2024 年¶

2025 年¶

自动化维护体系¶

相关分支和项目¶

主要分支架构¶

main 分支 - formicamycin 研究¶

v2 分支 - 增强版本¶

sensor 分支 - 传感器数据 RAG¶

分支对比总结¶

维护分支 (Dependabot)¶

数据集版本管理¶

chatt2 数据集版本对比分析¶

传感器数据集¶

部署信息¶

数据依赖¶

Y-team/chatt2 数据集¶

安全注意事项¶

深入源码分析¶

核心架构模式¶

前后端流式通信架构¶

前端实现细节¶

Svelte 5 响应式模式¶

模块化组件设计¶

后端实现细节¶

模块化路由设计¶

数据流架构¶

三层数据流¶

状态持久化¶

性能优化策略¶

安全与观测性¶

LangFuse 集成¶

模板系统¶

深入源码架构分析¶

设计模式解析¶

1. 抽象工厂模式的巧妙运用¶

王毅涵核心代码架构解析¶

1. LLM 客户端的极致封装 sensor/utils/llm_api.py¶

2. 流式处理的装饰器模式 sensor/utils/stream.py¶

3. 多模态检索系统 sensor/retrieval/¶

向量检索 vector_retrieval.py¶

图像检索 images_retrieval.py¶

4. 实用工具集的设计哲学¶

文件处理 file_read_write.py¶

格式转换 switch_format.py¶

5. 模块化的数据管理¶

6. 依赖管理的精简策略¶

代码风格总结¶

2. 缓存策略的多层设计¶

3. 响应式流处理模式¶

4. 预热机制的服务化设计¶

5. 模板系统的外部化管理¶

模块化架构的层次结构¶

跨分支的数据流架构¶

错误处理和观测性¶

性能优化的精细化设计¶

`main` 分支 - formicamycin 研究¶

`v2` 分支 - 增强版本¶

`sensor` 分支 - 传感器数据 RAG¶

1. LLM 客户端的极致封装 `sensor/utils/llm_api.py`¶

2. 流式处理的装饰器模式 `sensor/utils/stream.py`¶

3. 多模态检索系统 `sensor/retrieval/`¶

向量检索 `vector_retrieval.py`¶

图像检索 `images_retrieval.py`¶

文件处理 `file_read_write.py`¶

格式转换 `switch_format.py`¶