Sansan Tech Blog

Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信

NLP2023に参加・発表しました

こんにちは!研究開発部の黒木裕鷹です。

先日、沖縄のコンベンションセンターで開催された言語処理学会第29回年次大会(NLP2023)に参加してきました。 3月13日から3月17日までの開催で、多くの研究者や技術者が一堂に会し、最新の研究成果や技術動向を共有しました。 オンラインとオフラインのハイブリッド開催でしたが、セッション会場も大規模なポスター会場・企業ブースも常に賑わっていて、コロナ禍前の学会を思い出しました。 また、会期中にはGPT-4がリリースされたことなどもあり、規模だけでない盛り上がりをみせていたような気がします。

今回のブログでは参加レポートをお届けします。 私もテーマセッション「金融・経済ドメインのための言語処理」にて研究発表を行いましたので、その報告もしたいと思います。

言語処理学会年次大会(NLP)とは

NLPは、言語処理学会 (The Association for Natural Language Processing) が年に一度開催する大会で、言語処理にまつわる非常に幅広い分野からの研究報告、議論が行われます。 29回目の開催となる今回のNLP2023では、合計で579件の研究発表がなされ、参加人数は約1,800人にも上ったそうです。

報告件数が非常に多かったため、オーラル発表は発表15分、質疑3分というタイトなものでしたが、スムーズな運営とslackを中心にしたコミュニケーションは非常に良い体験でした。 セッションごとのチャンネルで資料が事前に共有されたり、追加での議論が行える体制は、たとえオフラインのみの開催に戻っても有意義なものになるのではないかと感じました。

会場の正面はこんな感じです。 せっかくですので沖縄感のある写真を選んでみました。

NLP2023 会場正面

テーマセッション「金融・経済ドメインのための言語処理」

本大会では、以下の3つのテーマセッションが企画されました。

  • 金融・経済ドメインのための言語処理
  • ことばの評価と品質推定
  • 地理空間情報と自然言語処理

私も発表した「金融・経済ドメインのための言語処理」では、合計3セッションにわたって15件の研究報告が行われました。 金融・経済のドメインでは、企業からの情報開示や新聞記事など、豊富な言語データが日々蓄積されています。 また、これらのデータを分析し、たとえば投資先の選定に役立てたり、経済指標を作成しようとするなど、活用の動きがますます広がっています。

会場でのディスカッションや懇親会など、参加者の方々との交流は非常に有意義なものとなりました。 ここからは、私の発表と聴講した発表について、その概要をいくつか紹介したいと思います。

研究発表

前述のテーマセッションにて、「決算説明会のテキスト特徴と株主資本コストの関連性」というタイトルで研究報告しました。 この研究は野村アセットマネジメント株式会社の中川慧さん、Sansan研究開発部の真鍋との共同研究になります。 また、金融イベントの書き起こしメディアであるログミー・ファイナンスから決算説明会のテキストデータを使わせていただきました。 それでは、研究の概要を紹介いたします。

決算説明会とは、企業が決算状況を説明する場で、決算短信の公開後速やかに開催されます。 また、参加者(機関投資家やアナリストなど)は質疑応答の時間を利用して、疑問を解消することができます。 このような説明会は、企業と投資家の双方向のコミュニケーションが行われることから、重要なIRの手段として位置づけられています。

先行研究では、義務による情報開示だけでなく、企業が積極的に情報を開示することで、情報の非対称性を軽減し、株式を通じた資金調達のコスト(株主資本コスト)を下げることができるといわれています(Diamond, 1985; Diamond and Verrecchia, 1991; 内野, 2005)。 この株主資本コストは、投資家の側から見ると、投資するのに値する最低限の期待リターンと解釈することができます。

しかし、決算説明会での発言内容が株主資本コストにどのように影響するかは、そのクオリティを定量評価する難しさもあり、これまであまり分析されてきませんでした。 そこで、この研究では、決算説明会のテキストの特徴が株主資本コストとどのように関連するかを分析しました。 具体的には、推定した株主資本コストを、コントロール変数(売上高の成長率や簿価時価比など)と共にテキスト特徴で回帰しました。 その結果、質疑応答の時間が長いほど、情報を積極的に開示する企業の資本コストが低くなる傾向があることが分かりました。

双方向のコミュニケーションである質疑応答をより充実させることが、決算短信や有価証券報告書といった開示文書を超える情報を投資家に伝え、資本コストを下げる、という可能性を示唆しています。 また、この結果は質の良い積極的な情報開示が資本コストの低下につながるとする先行研究とも整合的です。

研究の今後の展望としては、より拡大していくログミー・ファイナンスのテキストデータを継続して分析していくこと、質疑応答や説明のセクションでどのようなトピックが扱われることが、資本コストの低下と関連していくのかに注目していくなど、より内容に踏み込んだ研究を行っていくことが挙げられます。

この方向性で発展させていくことで、企業がより効果的なIR戦略を立てるための一助となることが期待されます。また、投資家にとっても、質疑応答の時間やトピックの分析を通じて、企業の情報開示の質や資本コストに関する洞察を得ることができるでしょう。

聴講内容

聴講した発表のなかからいくつかの発表の内容を紹介します。 より詳細なプログラムや原稿については大会プログラムページをご覧ください

D9-2 連続時間フラクショナル・トピックモデル

共同研究者でもある、野村アセットマネジメント株式会社の中川慧さんによる発表です。

代表的なトピックモデルとしてLDAが広く知られていますが、トピック分布の時間変化を扱うように拡張されたものとしては Dynamic Topic Model (DTM) や、連続時間に拡張した cDTM があります。 時事ニュースや経済トレンドを把握するために、金融ドメインのテキスト解析においては盛んに利用されてきました。

一方で、金融市場に影響を与える要因として、災害や金融ショックは、非連続的にトピック分布を変えることが想定されます。 そこでこの研究では、トピック分布の時系列変化にブラウン運動を仮定するのではなく、より裾の広い変化を許す非整数階ブラウン運動を導入しています。 非整数階運動運動のHurst指数を制御することで、トピック分布が短時間に大きく変化する現象を捉えることがモチベーションです。 結果として、トピック分布の変動のラフさを捉えられるようになったことを示しています。

MCMCによる推定が行われていましたが、非常にハードな推定であったと推察します。 ハースト指数を与えるのではなく、市場状況として推定することには大きな意義がありそうなので、そこも含めた今後の拡張が気になりました。

D10-5 監査上の主要な検討事項 (KAM) の前例踏襲の程度に関する業種別及び監査法人別の傾向分析

日本証券取引所株式会社グループの土井惟成さんによる発表です。

上場している企業は、有価証券報告書を作成し金融庁に提出する義務があります。 有価証券報告書は財務諸表などを含み、監査人による監査証明が必要となる開示書類です。 また、2021年3月期からは、監査報告書に「監査上の主要な検討事項(KAM)」の記載が原則として求められるようになりました。 KAMには、財務諸表の監査において、監査人が特に重要だと判断した事項が記されることになります。 定型化や画一化されてしまう現象「ボイラープレート化」が起こり、その有益性が損なわれてしまうことが懸念されています。 同じ企業内で、毎年のKAMの記載内容が定型化されてしまう現象は「縦のボイラープレート化」、各上場会社の記載が横並びで似通った内容となる状態は「横のボイラープレート化」とよばれます。

この研究では、業種別に縦のボイラープレート化の傾向が分析されています。 具体的には、KAMのテキストデータから、2年分の単語頻度に基づくベクトルを企業ごとに算出し、コサイン類似度を用いて、業種別の類似度の傾向を分析しています。また、監査法人別の縦のボイラープレート化についても分析されています。 多様な結果が報告されていますので、是非元の原稿をご覧ください。

これまで企業からの開示文書そのものに興味はもっていましたが、その監査についても非常に興味深く、勉強させていただきました。 企業の活動の一部を捉える手段として、今後着目していきたいと思います。

おわりに

久々のオフライン開催ということで、大変盛り上がった大会でした。 運営委員の皆様、交流いただいた皆様、参加者の皆様に感謝申し上げます。 こうした交流に今後も参加できるように、これからもまた頑張っていこうと思います。

参考文献

  • Douglas W Diamond. Optimal release of information by firms. The Journal of Finance, Vol. 40, No. 4, pp. 1071–1094, 1985.
  • Douglas W Diamond and Robert E Verrecchia. Disclosure, liquidity, and the cost of capital. The Journal of Finance, Vol. 46, No. 4, pp. 1325–1359, 1991.
  • Jeremy Bertomeu and Roert P Magee. "Mandatory disclosure and asymmetry in financial reporting." Journal of Accounting and Economics, Vol. 59.No. 2-3, pp. 284-299, 2015.
  • 内野里美. 自発的な情報開示が自己資本コストに与える影響. 現代ディスクロージャー研究, Vol. 6, pp. 15–25, 2005.

© Sansan, Inc.