Molecular Universe
分子结构-气味可视化
数据路径与模式说明见右上角 ? 帮助。
TopN聚焦模式切换
清空筛选
降维方式
共现排行榜
气味标签筛选
特征筛选
分子量范围
1000
分子数目上限
1000
渲染模式
性能实验
界面操作说明
- 顶部菜单栏
- 主页:展示两种位置编码方式下的3D分子散点图。每个画布中,鼠标左键拖动旋转,滚轮缩放,点击右下角可以放大。鼠标悬浮在粒子上可查看分子简介。点击粒子可查看分子详情。
-
数据概览:展示138种气味标签对应的标签分子数分布条形图,以及TopN标签下的标签分子数分布条形图、分子标签数分布条形图、标签共现热力图、标签-特征热力图、标签共现和弦图、分子量小提琴图。每个图表支持悬浮提示、放大显示与下载SVG。除分子标签数分布图外,均支持点击筛选。
- 分子对比:可对比当前加入已对比分子的结构、标签和特征,点击可跳转至对应分子详情。
- 信息查询:支持SMILES全名或标签全名检索分子,点击可跳转至对应分子详情。
- 左侧操作面板
- 数据集选择:默认读项目根目录;若根目录不存在会自动再尝试
data/ 同名路径。单文件选 *.json,分片选 *.manifest.json。
- 主题切换:可切换浅色/深色主题。
- TopN聚焦模式:可设置高频标签的数量,切换高亮模式。
- 清空筛选:可清空当前筛选。
- 降维方式:可选择PCA、t-SNE或UMAP降维方式。
- SMILES/散点切换:可切换显示分子SMILES或仅显示分子点。
- 共现排行榜:展示气味标签共现/气味+特征标签共现数目排行榜Top12,点击可筛选对应的两个标签。
- 气味标签筛选:可选择感兴趣的气味标签进行筛选。
- 特征筛选:可选择感兴趣的分子特征进行筛选。
- 分子量范围滑块:控制显示分子的最大分子量。
- 分子数目上限滑块:控制显示的最大分子数目。
- 渲染模式:
hybrid_lod 为混合 LOD;full_image 为压力测试;chunk_mode 为分片加载。分片失败时会弹窗询问是否回退单文件。
- 相似推荐:优先读取邻居分片(TopK)。现在即使是
hybrid_lod/full_image 也会尝试自动挂载同名 manifest 的邻居数据;若没有邻居分片,推荐列表为空。
- 分子图显示:
hybrid_lod/full_image 才显示 LOD 分子图片;chunk_mode 以分片加载稳定性为主,不展示 LOD 分子图片(可配合 SMILES 显示)。
- 性能实验:采样与导出性能日志,详见仓库
docs/performance-benchmark.md。
- 右侧信息面板
- 分子详情:显示分子SMILES、IUPAC名称、2D结构图、气味标签云和特征标签云。其中气味标签云和特征标签云可点击筛选。点击复制可复制分子SMILES。点击加入对比可将分子加入对比。
视觉编码说明
- 主页视觉编码说明
- 点颜色:表示为气味标签。可在左侧切换TopN高频标签模式或全部色彩模式。
- 当选中标签(特征)的数目为1时,全部红色高亮。
- 当选中标签(特征)的数目大于1时,有其中一种标签(特征)的显示为彩色,包含全部选中标签的标识为红色高亮。
- 点大小:表示分子量大小。
- 点坐标:共有基于分子指纹的(结构空间)以及基于分子气味标签的(气味空间)两种方式表示点位置,可选择PCA、t-SNE或UMAP降维方式。
- 图例:左侧为点的颜色表示的气味特征,红色边框为当前筛选。中间为分子量大小示意。右侧指示红色为共现。
- 数据概览界面视觉编码说明
- 标签分子数分布条形图:每个柱表示TopN/Top138标签下每个气味标签的分子数分布,颜色表示气味标签,和主界面颜色对应,选中的标签颜色变为粉红色。
- 分子标签数分布条形图:每个柱表示TopN标签下每个气味标签的分子数分布。
- 标签共现热力图:横轴和纵轴均表示气味标签,标签每个格表示TopN标签下气味标签共现次数,两个标签共现次数多颜色深。
- 标签-特征热力图:横轴表示特征标签,纵轴表示气味标签,每个格表示TopN标签下特征出现次数,两个标签共现次数多颜色深。
- 标签共现和弦图:每个环形分段表示TopN标签下每个气味标签,颜色表示气味标签。每条弦表示Top20标签间的共现关系,弦宽代表共现次数。
- 分子量小提琴图:横轴表示气味标签,纵轴表示分子量大小。每个小提琴表示Top20标签下平均分子量分布,颜色表示气味标签。
数据加载中...