[2/3] 昨天在 Alveo U200 上成功运行了 32 个 riscv64 CPU 的 Linux 以后,性能测试放弃了——基于 R 的性能测试目测比我的笔记本慢 500 倍…… 后来我回到此卡推荐的使用方式上——作为数据中心加速卡,结果也不太顺利。Xilinx 的天才硬件工程师们在 FPGA 上实现了一个可动态修改自身部分电路的加速器——PCI 接口部分的电路保持不动,特定计算的电路可随时加载后执行。它的 OpenCL 接口就只支持 1.0 版本,设备类型是加速卡(而非 CPU 或 GPU),如果跟着 OpenCL 教材走的话立刻就会遇到无法以源代码的形式定义核函数的困难——必须在相同或另外的机器上用 Vitis 软件编译可加载的电路模块然后以二进制形式加载。我现在想知道在典型应用(比如深度学习和大模型)中我这块卡到底对标 NVIDIA 哪个 GPU,以及如何把 “典型应用” 实际跑起来……
https://postimg.cc/gallery/43xQF4T




