AI/機械学習プロジェクト

AI/機械学習プロジェクト

AI / Machine Learning Project

業界特化型の新たな与信モデルを
構築する
データサイエンスチーム

ランドデータバンクプロジェクト打ち合わせ

ランドデータバンクでは、業界に特化したさまざまなデータを活用し、独自の与信モデルを構築しています。既に商⽤フェーズにある独⾃の与信モデルですが、さらに精度を⾼めるため、⽇々新たなデータの収集、クレンジング、分析、確率予測を⾏っています。
その中⼼となっているのは、機械学習や統計などのデータサイエンスの専⾨家が集まる「データアナリシス部」のメンバーです。過去に例のない取り組みであるため、各メンバーが知恵を出し合い時には苦労しながら業務を⾏っています。
メンバーは、プロジェクト全体をマネジメントする池⽥、プロジェクトの技術的なリーダーを務める甲斐、学⽣ながらデータサイエンティストとして⾼いスキルを持つ安⽥と渡辺の4名です。

メンバー紹介
  • 池田 雅弘

    池田 雅弘

    Masahiro Ikeda

    ソフトバンク(旧ソフトバンクBB)の財務経理部門でキャリアをスタート。数百億円規模の設備投資管理等を経験。経営企画に異動後は、通信4社の合併や子会社の事業計画責任者としてアジア展開に貢献。2020年11月から当社に参画。

  • 甲斐 詢平

    甲斐 詢平

    Shumpei Kai

    東京大学大学院博士課程を修了(理学博士)。専門は化学。株式会社光通信にて、BPR、webマーケティング、CS改善に従事。日本の中小建設事業者の生産性向上と成長に貢献するために、2021年1月より当社に参画。

  • 安田 利玖

    安田 利玖

    Riku Yasuda

    慶應義塾大学理工学部に所属。専攻は情報工学。2022年春より東京大学大学院工学系研究科に進学予定。2021年5月よりインターンに参加しており、データ分析の業務に従事。学業の傍ら週に4日程度オフィスに出向き、研究を進めている。

  • 渡邊 光

    渡邊 光

    Hikaru Watanabe

    東京大学工学部システム創成学科所属。2022年春より同大学院に進学予定。大学では金融工学・機械学習を専攻。2021年8月から当社にインターンとして参加し、データ分析・与信モデルの構築業務に従事。学業の傍ら週3日程度オフィスに出向き研究を進めている。

  • 池田 雅弘

    池田 雅弘

    Masahiro Ikeda

    ソフトバンク(旧ソフトバンクBB)の財務経理部門でキャリアをスタート。数百億円規模の設備投資管理等を経験。経営企画に異動後は、通信4社の合併や子会社の事業計画責任者としてアジア展開に貢献。2020年11月から当社に参画。

  • 甲斐 詢平

    甲斐 詢平

    Shumpei Kai

    東京大学大学院博士課程を修了(理学博士)。専門は化学。株式会社光通信にて、BPR、webマーケティング、CS改善に従事。日本の中小建設事業者の生産性向上と成長に貢献するために、2021年1月より当社に参画。

  • 安田 利玖

    安田 利玖

    Riku Yasuda

    慶應義塾大学理工学部に所属。専攻は情報工学。2022年春より東京大学大学院工学系研究科に進学予定。2021年5月よりインターンに参加しており、データ分析の業務に従事。学業の傍ら週に4日程度オフィスに出向き、研究を進めている。

  • 渡邊 光

    渡邊 光

    Hikaru Watanabe

    東京大学工学部システム創成学科所属。2022年春より同大学院に進学予定。大学では金融工学・機械学習を専攻。2021年8月から当社にインターンとして参加し、データ分析・与信モデルの構築業務に従事。学業の傍ら週3日程度オフィスに出向き研究を進めている。

機械学習風景機械学習風景

固定概念にとらわれずに
ランドデータバンク流の機械学習

機械学習とは、「コンピューターによって大量のデータから法則、パターンを見つけること(=学習)」です。建設業界や建設現場にはさまざまなデータ・情報があります。これらのデータを大量に集め、与信情報と照らし合わせながら機械学習をすることで建設業特化の与信モデルの構築を進めています。
機械学習で大事なのが、「学習データの用意」です。機械学習というと、プログラムコードを書くなどのシーンを思い浮かべる方もいらっしゃるかと思いますが、実際に重要で時間もかかるのが学習データの収集やクレンジングです。
例えばCSVで数万から数百万件のデータを扱うのですが、データが抜けているケースがよくあります。
そういった箇所があると、思ったように機械学習を行えないことがあります。
また、データの入手元が異なることでデータの入力形式が異なっていたりして、思った結果を得られないこともあります。そういったことが起こらないように事前にデータを整える作業(クレンジング)に時間がかかるのですが、ランドデータバンクではここを丁寧に行っています。

モデルに使う説明変数モデルに使う説明変数

また、モデルに使う説明変数の検討にも力を入れています。説明変数とは、期待する結果(目的変数)を得るために投入するデータのことです。建設現場、業界には様々なデータがあるので、どのようなデータを使って機械学習をすればよいか、日常的にチームでディスカッションを行っています。
建設現場や業界知識も必要になってくるので、データサイエンティストのチームだけではなく、営業社員等、社内の人間を巻き込んでデータの検討をします。
ランドデータバンクのデータサイエンティストチームは固定観念にとらわれずに、目的に沿って、様々なやり方で挑戦することを大切にしています。

モデルに使う説明変数ディスカッションモデルに使う説明変数ディスカッション

日々のキャッチアップ

日々のキャッチアップ日々のキャッチアップ

業務では、機械学習やAIや統計に関するスキルをキャッチアップすることも重要ですが、建設業や金融知識を身に着けることも大切になってきます。みな、入社時点では建設や金融の知識はないので、入社後にキャッチアップをします。勉強会のようなものを開催することもありますが、業務に必要な知識を拾っていくと、自然に知識が身についていく形です。建設業者や行政書士、法改正などの情報もキャッチアップしています。
また、機械学習に関するミーティングやディスカッションでは、正社員も、インターン生も関係なく、闊達に意見交換をしています。
インターン生の採用も積極的に行っていますので、興味をお持ちの方は採用ページからお問い合わせください。

プロジェクトメンバープロジェクトメンバー