

新闻资讯
技术百科Archetype 通过将相同组件集合的实体聚合成连续内存块并按列存储组件数据,使CPU缓存预取高效,遍历时避免随机访问;Sparse Set用dense/sparse双数组实现O(1)实体ID查找。
Archetype 的核心是把拥有相同组件集合的实体聚合成连续内存块,避免遍历时跳来跳去。比如 Position + Velocity 的实体全挤在一块数组里,CPU 缓存预取就能一次拉进多个对象,而不是在堆上随机找。
关键点在于:每个 Archetype 对应一个独立的 std::vector(或自定义连续容器),里面只存该组合的组件数据(通常按列存储,如所有 Position.x 连续、所有 Position.y 连续),而非实体对象本身。
实体 ID 通常是稀疏整数(比如删过 ID=5 的实体,剩下 0,1,2,3,4,6,7…),直接用 std::vector 存储会导致大量空洞。Sparse Set 用两个数组配合解决这个问题:
m_dense:连续数组,存当前所有有效实体 ID(顺序不保证,但紧凑)m_sparse:大小等于最大可能 ID 的数组,m_sparse[id] 存该 ID 在 m_dense 中的索引;若 ID 无效,则值为 -1 或超出 m_d
ense.size()
这样查某个 ID 是否存在、获取其内部索引,都是 O(1);插入/删除也是 O(1)(插入追加到 m_dense 并更新 m_sparse,删除则交换末尾元素并更新两个数组)。
// 简化版 SparseSet::contains 实现
bool contains(EntityID id) const {
return id < m_sparse.size() && m_sparse[id] < m_dense.size() && m_dense[m_sparse[id]] == id;
}
Archetype 管「数据怎么放」,Sparse Set 管「实体 ID 怎么映射」,两者分工明确但必须对齐:
Position + Velocity,它只遍历对应 Archetype 的数据块,而不用扫描全部实体——Sparse Set 确保这个“查找 Archetype”过程不拖慢整体如果只用 Archetype 不管 ID 映射,那每次通过 ID 查组件就得线性扫所有 Archetype;如果只用 Sparse Set 不分 Archetype,那遍历组件时又回到内存不连续的老问题。
真正影响性能的不是“用了没用”,而是具体怎么布局:
std::vector positions_x; 和 std::vector positions_y; 分开,方便 SIMD 向量化m_sparse 数组如果太大(比如支持 2^32 个 ID),会吃掉几 GB 内存——实际项目常用 16 位或 24 位 ID,配合分段 Sparse Set 或哈希 fallbackstd::string),memcpy 会出错;必须用 placement new + 析构函数手动管理这些细节不写进代码注释、不测 cache miss 率、不看 perf report,很容易以为“架构对了就一定快”。