|
ハヤシ ユウキ
Yuki Hayashi
林 勇樹 所属 追手門学院大学 社会学部 社会学科 追手門学院大学 大学院 現代社会文化研究科 現代社会学専攻 職種 准教授 |
|
| 言語種別 | 日本語 |
| 発行・発表の年月 | 2026/03 |
| 形態種別 | 紀要(First author) |
| 標題 | スポーツ団体による大規模測定に伴うデータハンドリングのためのテンプレート型データ抽出システムの開発 |
| 執筆形態 | 単著 |
| 掲載誌名 | 追手門学院大学スポーツ研究センター紀要 |
| 掲載区分 | 国内 |
| 巻・号・頁 | 11,9-24頁 |
| 総ページ数 | 16 |
| 担当区分 | 筆頭著者 |
| 概要 | スポーツ団体では、選手育成の支援および縦断的データセットの構築を目的として、大規模な身体測定・体力測定を実施する機会が増えている。競技結果はデジタル形式で記録されることが多い一方で、新たに設計された測定項目については、会場で手書きにより記入される紙の用紙に依存することが多く、その結果、イベント後のデータ入力作業が大きな負担となり、フィードバックの遅延を招いている。本稿では、このような紙ベースの測定について、受付および用紙発行から、OCR支援によるデジタル化、検証、結果返却に至るまで、エンドツーエンドでの処理を支援するテンプレートベースのデータ抽出システムの開発について報告する。
本システムは以下の要素から構成される。すなわち、(i) オンデマンドで用紙を生成・印刷し、予測不能なGUIDを割り当ててQRコードとして印字するモジュール、(ii) コーナーのL字マーカーを用いたホモグラフィに基づく位置合わせと、OpenCV.jsで実装したSafeZone制約付きHough直線検出を行う、ブラウザベースのOCRモジュール、(iii) GPT-4oビジョンAPIを用い、並列度を構成可能としたセル単位の一桁数字認識、(iv) サーバーサイドでの検証・保存およびWebベースのフィードバック、である。 現場の制約のもとで行った設計上の選択についても述べる。具体的には、1セル1桁の用紙レイアウト、調整可能なパディングを備えたJSONベースの領域テンプレート、そしてグループ識別子を用いて複数セルにまたがる値を再構成する汎用的な仕組みである。大規模な測定イベントが開始されると運用上の変更が困難になるため、開発は反復的かつ時間的制約のあるものとなった。異種コンポーネント間の迅速な統合のための開発補助として大規模言語モデル(LLM)を利用し、各反復において人間によるレビューを行った。複数のイベントから得られた運用ログを分析し、収集モード(現地スキャン vs. 郵送による提出)の違いによるスループットと登録遅延の特性を明らかにした。 本研究の貢献は、新しいOCRアルゴリズムを提示することではなく、スポーツ測定におけるテンプレートベースのデータ抽出を実運用に展開するための実践的な統合パターンと運用知見を提供することにある。 |