日本語 English
Takuto Ando
安藤 拓翔 Takuto ANDO
博士前期課程2年 · コンピューティング・アーキテクチャ研究室
奈良先端科学技術大学院大学
AI や画像処理技術を計算機アーキテクチャの視点から探求し、持続可能で高効率な AI 計算基盤の構築を目指しています。近年は非ノイマン型アクセラレータ IMAX 上での LLM・生成 AI・音声認識の実装と最適化に取り組み、高専時代には FPGA 推論や農業画像認識の研究も進めてきました。
3
国際論文誌
7
国際会議
7
受賞
7
国内発表

主にソフトウェアスタックの実装を行っています。ランタイムのボトルネック解析、アプリケーション実装を横断し、IMAX を中心とした CGLA 系計算基盤で実用的な AI ワークロードをどう支えるかを研究しています。エッジからサーバまでを視野に、ハードウェアとソフトウェアの接点を重視しています。

研究キーワード 計算機アーキテクチャ AI アクセラレータ CGLA / CGRA LLM 音声認識 画像生成 ハードウェア・ソフトウェア協調設計
ニュース
CGLA向けLLM実行最適化
LLM GUI チャット
CGLA向けLLM実行最適化
静的なチャンク分割で顕在化する転送オーバーヘッドに着目し、量子化条件に応じてチャンクサイズを動的に決める Q-snap を提案した。プリフィルで 1.62 倍の高速化を確認している。
Best Paper - ICISN 2026 Young Researcher - SASIMI 2025 IEEE Access
生成 AI の CGLA 上での実装
MCSoC 2025 評価
生成 AI の CGLA 上での実装
Stable Diffusion を IMAX 上に実装し、LLM 以外の生成 AI ワークロードにも適用できることを評価した。エンドツーエンドの性能と電力効率を確認している。
MCSoC 2025
音声認識(ASR)の高効率実装
CANDAR 2025 ワークフロー
音声認識(ASR)の高効率実装
Whisper を IMAX 上に実装し、独自の FP16 演算カーネルを開発した。省電力推論を実現しながら、CGLA の汎用性を示している。
Best Paper - CANDAR 2025 arXiv:2511.02269
IMAX アーキテクチャの評価と実装
IMAX アーキテクチャ
IMAX アーキテクチャの評価と実装
演算ユニットとキャッシュメモリを交互配置した非ノイマン型 CGLA。エッジ向け IMAX3 とサーバ向け IMAX4 の比較評価やアプリケーション実装に取り組んでいる。
CGRA / CGLA Near-Memory Computing Edge and Server
FPGA による表情認識システム
FPGA マルチタスク構成
FPGA による表情認識システム
DPU ベースの DNN アクセラレータを用いて、FPGA 上でリアルタイム表情認識システムを実装した。マルチスレッド化と低消費電力化を両立している。
ICIC Express Letters 2025 CANDARW 2024 情処全国大会 2025
DNNベースの小ねぎ分岐部検出
YOLOX 検出結果
DNNベースの小ねぎ分岐部検出
背景や照明条件が複雑な環境に対応するため、YOLOX ベースの検出とインスタンスセグメンテーションを用いた分岐部検出を検討した。自動調製機への実応用を見据えた認識系として整理している。
ICIC Express Letters 2026 電子情報通信学会九州支部学生会講演会 2024
エッジ検出による小ねぎ分岐部検出
自動調製パイプライン
エッジ検出による小ねぎ分岐部検出
小ねぎ分岐部に現れる斜線に着目し、エッジ検出ベースの軽量アルゴリズムを構成した。Raspberry Pi 3 上で検出率 90.6%、処理時間 455 ms を確認している。
ICIC Express Letters 2026 農業情報研究 2024
受賞歴
2026.03
Best Paper Award
ICISN 2026
2025.11
Best Paper Award
CANDAR 2025
2025.10
IEEE CEDA All Japan Joint Chapter SASIMI Young Researcher Award
SASIMI 2025
2025.03
学生奨励賞
情報処理学会 第87回全国大会
2025.03
日本高専学会奨励賞 優秀賞
日本高専学会
2025.03
理事長表彰
高専機構
2025.03
学術奨励賞
電子情報通信学会 九州支部
現在注力していること
システム全体のボトルネック解析

カーネル単体ではなく、ホスト CPU、DMA 転送、chunk サイズ、ランタイム方針まで含めて end-to-end の支配要因を見ています。

再利用可能なソフトウェアスタック

個別アプリ向けの実装にとどまらず、IMAX 上で複数の AI ワークロードを支えられるソフトウェア基盤の整理に関心があります。

エッジからサーバへの展開

IMAX3 と IMAX4 の比較を通じて、アクセラレータ本体とホストインフラがどう協調すべきかを検証しています。

ギャラリー
ICISN 2026 ICISN 2026 presentation SASIMI 2025 SASIMI presentation IPSJ 2025 CANDAR 2024 presentation
CANDAR 2025 presentation MCSoC 2025 presentation Ikoma Relay Marathon 2025