NECが出した数字の重さ
NECが「有価証券報告書1300ページをExcelに整理していた業務を、AI導入で工数93%削減した」と発表した。
この数字、IR部門や監査法人、コンサル、金融機関のリサーチ担当なら身につまされると思う。1300ページという規模はNEC級の大企業の最大クラスだが、標準的な上場企業でも数百ページある。そして「PDFを読んでExcelに転記する」という作業の構造は、業界を問わずかなり広い範囲で存在している。NEC固有の話ではない。
今回はこの事例を起点に、有報をAIで処理するときの選択肢を整理してみる。
そもそも有報の中身はどれだけ濃いか
有価証券報告書には、財務諸表(BS / PL / CF、連結+単体)、セグメント情報、事業等のリスク、MD&A(経営成績の分析)、コーポレート・ガバナンス、役員報酬、大株主の状況、会計方針・注記——これらが詰め込まれている。
数値とテキストが混在していて、1社1年分で100〜1300ページ。日本の開示制度の中で情報密度が飛び抜けて高い書類だが、人間が通読できる量ではない。「読んでExcelに転記する」という作業が業務として成立していること自体が、ある意味では構造的な問題を示している。
AIで処理するときの3択
有報をAIに渡して何かしらの処理をさせたいとき、選択肢は大きく3つある。
選択肢1:PDFをそのままLLMにパースさせる
EDINETからPDFをダウンロードして、ClaudeやGPTに直接投げる方法。初期コストはほぼゼロで始められる。PoC(概念実証)には向いているが、1300ページともなればコンテキスト超過か相当な従量課金になる。精度面でも、表の読み間違いや連結/単体の混線、注記の取り違えが起きやすい。複数社×複数年で回すとなると、コストも精度もブレる。
選択肢2:社内で構造化する(NEC方式)
EDINETから書類を取得し、AI+人手でパース・検証・Excel化するパイプラインを社内で構築するやり方。NECの事例はこれにあたる。初期構築にエンジニアの工数が必要で、OCR/LLM APIの従量課金も積み上がる。ただし内部ルールで検証できるため継続的に精度を上げられる。副次効果として、社内にAIエージェント運用のノウハウが蓄積される点も大きい。93%削減という数字は、ここまで投資した成果として見るのが自然だ。
選択肢3:構造化済みデータを外部APIから取る
選択肢2を自社でやる代わりに、すでに構造化されたデータを外部APIから取得する方法。日経バリューサーチ、スピーダ、BuffettCodeといった商用サービスがここに該当する。EDINET DBもこの類で、有報の財務・テキストを構造化してAPI / MCP経由で提供している。初期コストは小さく、数秒でデータにアクセスできる。ただし提供側が構造化していない項目は取れない、という制約がある。
3つを比較すると、初期コスト・精度・スピード・カスタマイズ性のトレードオフは明確だ。どれが正解という話ではなく、自社の業務量・精度要件・カスタマイズ要件で決まる。
「93%削減」の裏にある不都合な前提
ここで少し立ち止まって考えてみると、93%削減できたという事実は、元の業務が構造的に非効率だったことを意味する。
「読んで・Excelに転記して・集計する」というプロセスは、AIが登場するまでは仕方なかった。でも今、それが93%削減できるなら、開示書類の側が「読ませる」よりも「渡せる」形で出てくるべきではないか、という問いが自然に浮かぶ。XBRLやAPI経由の直接参照は、まさにその方向の話だ。
AIが有報を読む前提が当たり前になっていけば、開示書類の形態自体も変わっていく可能性がある。NECの事例は、業務効率化の話であると同時に、今の開示の非効率さを数値で可視化したという意味もある。
実務的にどう選ぶか
NECのように業務量が多く精度要件も高い組織は、選択肢2に合理性がある。初期投資が重いぶん、長期的には精度とノウハウが積み上がっていく。
一方、個人や小規模チームが選択肢2から入るのは現実的でない。選択肢3を軸に、どうしても足りない部分だけ選択肢1か2を補う、というのが現実解になりやすい。
たとえばEDINET DBのAPIを使えば、ソニーグループのセグメント情報(直近5年分)をPythonで数行書くだけで1秒以内に取得できる。有報のセグメント情報をPDFから手で抜くと1社あたり数十分かかる作業が、これだけ変わる。MCP経由でClaude Desktopに接続すれば、「トヨタの5年間のROE推移を教えて」と聞くだけで有報由来のデータを使った回答が返ってくる。Excelへの転記は挟まらない。
なお、EDINET DBは2025年4月から研究者向けの無料プランも出している。大学・大学院・研究機関の個人研究者であれば有報APIを無料で使えるとのこと。「データ入手の段階で詰まる」という実証研究あるあるへの対処として、覚えておいて損はないと思う。
まとめ
NECの93%削減は派手な数字だが、着目すべきは「1300ページをExcelに転記していた業務がそれだけあった」という前提のほうかもしれない。AIが処理できるなら、今後は処理しやすい形で情報が提供される方向に引力が働く。
有報をAIで扱うなら、まず自分の組織の業務量と精度要件を確認してから選択肢を選ぶ。それだけで、余計な回り道をかなり減らせる。