コウヤ トモノリ   Tomonori Kouya
  幸谷 智紀
   所属   追手門学院大学  理工学部 数理・データサイエンス学科
   職種   教授
研究期間 2020/04~2023/03
研究課題 マルチコアCPU向けに最適化された高速任意精度線形計算ライブラリの開発
実施形態 科学研究費補助金
研究委託元等の名称 日本学術振興会
研究種目名 基盤研究(C)
研究機関 静岡理工科大学
代表分担区分 研究代表者
研究者・共同研究者 幸谷 智紀
概要 2021年度は(1)前年度までに達成したSIMD,特にx86_64アーキテクチャCPUでは一般的に使用できるAVX2を用いたマルチコンポーネント型多倍長精度浮動小数点演算(DD(Double-Double), TD(Triple-Double), QD(Quad-Double)及びその派生型(TS(Triple-Single)等)に基づく基本線形計算の高速化の成果を査読付き研究発表論文(ICCSA 2021とARITH 2021)として公表し,更に高みに登るための(2)コンシューマ向けGPU環境における多倍長行列乗算ベンチマークテストと(3)尾崎スキームによる行列乗算の高速化の試みを行った。以下(1)~(3)の概要を述べる。 (1)ICCSA2021においてDD(106bit精度), TD(159bit), QD(212bit)精度の行列乗算をAVX2によって高速化できることを,OpenMPによる並列化を行ったブロック化行列乗算,Strassen行列乗算に対してベンチマークテストを行って示した。またARITH2021においてAVX2を用いたLU分解が高速であることも示した。 (2)コンシューマ向けNVIDIAグラフィックスカード上でCUDAを用いたTS(72bit)精度行列乗算の実装を行い,binary64精度演算を超える高精度かつ高速化が実現できることを示した。 (3)尾崎スキームを用いたTD精度演算の実装を行い,CPU上では現状最も高速なAVX2化したStrassen行列乗算より高速に実行できることをベンチマークテストで示した。しかしGPU上では尾崎スキームが有効に働かず,少なくともcuBLASのSGEMMを用いる限り,ブロック化行列乗算よりも低速にとどまることが判明した。
PermalinkURL https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-20K11843