- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

Faiss适配昇腾开源验证任务心得

yd_250945115 发表于 2024/12/17 15:42:12 2024/12/17

【摘要】 Faiss是一个高效的相似性搜索和密集向量聚类库。本项目致力于实现Faiss在华为昇腾NPU、鲲鹏CPU和EulerOS操作系统上的部署演示. 主要目的是通过不同的索引类型,探索在给定查询和评估准则下的最佳性能点

一、背景介绍

Faiss是一个高效的相似性搜索和密集向量聚类库。本项目致力于实现Faiss在华为昇腾NPU、鲲鹏CPU和EulerOS操作系统上的部署演示. 主要目的是通过不同的索引类型,探索在给定查询和评估准则下的最佳性能点,本文将介绍在华为的Ascend NPU上配置Faiss项目的详细开发步骤、遇到的问题和解决方案, 以及心得总结。

项目源地址: https://github.com/facebookresearch/faiss/tree/main

二、开发步骤

一、进行鲲鹏CPU适配

1.购买华为云虚拟私有云VPC和弹性云服务器ECS

详解教程参考链接：https://support.huaweicloud.cn/qs-ecs/ecs_01_0103.html 已有忽略

2.环境搭建

python版本为: 3.9

代码拉取:

git clone https://github.com/facebookresearch/faiss.git

cd faiss.git

安装faiss向量数据库

使用Anaconda安装使用faiss是最方便快速的方式，facebook会及时推出faiss的新版本conda安装包，在conda安装时会自行安装所需的libgcc, mkl, numpy模块。

pip install faiss-cpu

从源码安装 : Faiss可以使用CMake来源地构建。

cmake版本为 3.24.0

#下载faiss源码

git clone https://github.com/facebookresearch/faiss.git
#进入faiss目录，建立build文件夹
cd faiss
mkdir build
#开始编译，不编译GPU
cmake -B build . -DFAISS_ENABLE_GPU=OFF -DBUILD_SHARED_LIBS=ON
make -C build -j faiss
sudo make -C build install

运行官方验证代码官方验证代码地址: https://github.com/facebookresearch/faiss/wiki/Getting-started

若出现以下结果，恭喜你，faiss的基本安装已经完成！

3.下载数据集

数据集地址: https://huggingface.co/datasets/qbo-odp/sift1m/tree/main 下载下面四个数据集

4. 准备测试

鲲鹏环境部署：

运行如下命令

python demo_auto_tune.py

官方文档地址：

https://github.com/facebookresearch/faiss/blob/main/demos/demo_auto_tune.py

运行测试文件：python demo_auto_tune.py

运行结果：

1. 打印load data、 load GT、prepare criterion等提示信息，表明数据加载和评价准则准备等阶段的开始，针对每个索引配置进行处理时，============key<索引配置的信息>，提示正在处理的索引配置。

2. 展示训练与添加数据、探索操作点以及展示结果操作点这些步骤花费的时间，时间精度到小数点后3位，有助于了解各步骤的耗时情况。

3. 每个索引配置探索操作点后，展示该索引配置对应的操作点详细信息，包括召回率、搜索时间等指标的具体数值，展示该索引在不同设置下的性能表现。

4. 展示综合所有已测试索引配置后得到的最终最佳操作点信息，从整体上对比不同索引配置下的最优性能情况。

二、进行昇腾npu适配

npu环境

昇腾环境：芯片类型：昇腾910B3 CANN版本：CANN 7.0.1.5 驱动版本：23.0.6 操作系统：Huawei Cloud EulerOS 2.0

1. 查看npu硬件信息

如果 Health 状态为 OK，说明 NPU 和 CANN 正常运行。

2. 在 demo_auto_tune.py 中加入

官方文档地址：

https://github.com/facebookresearch/faiss/blob/main/demos/demo_auto_tune.py

import torch
import torch_npu
from torch_npu.contrib import transfer_to_npu

3. 准备测试

然后编译运行指令不指定运行设备, 这个会自动使用NPU运行, 这个是因为代码中默认使用cuda运行, 但是使用了自动迁移, 所以会从cuda迁移到NPU上。运行命令: python demo_auto_tune.py

运行结果：

2. 展示训练与添加数据、探索操作点以及展示结果操作点这些步骤花费的时间，时间精度到小数点后3位，有助于了解各步骤的耗时情况。

4. 展示综合所有已测试索引配置后得到的最终最佳操作点信息，从整体上对比不同索引配置下的最优性能情况。

三、遇到的问题和解决方法

问题1: 运行轮次较多, 且每次运行都会对每种索引执行索引创建训练索引添加数据参数探索操作点记录导致运行时间较长, 报错点不易查找。

解决方法: 运行测试命令时, 添加打印日志命令, 可以在日志文件中查找到具体的报错信息,并加以修改。

问题2: cmake-3.19.3版本过低, 算子尚未兼容, 提高cmake版本

解决方法: 下载预编译的CMake二进制包cmake-3.24.0.tar.gz, 解压包文件 tar -xvf cmake-3.24.0

问题3: torch版本过高, 算子尚未兼容, 降低torch版本

解决方法: pip install torch==2.1.0 torch_npu==2.1.0

四、心得总结

在整个适配过程中, 遇到了多个技术挑战, 主要问题还是环境配置相关问题, 通过根据报错信息理解和做出相应的修改、打印日志等方法去解决。以上主要是围绕faiss库进行向量索引的构建、训练、操作点的探索及结果展示，对比不同索引配置在给定数据集和评价准则下的性能优劣，帮助用户选择合适的索引方案用于实际的向量检索任务。希望这些经验可以帮助到其他开发者在类似环境中顺利部署和运行Faiss项目。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入