アナログ情報のデジタル化の仕組みとオペレーション

「Sansan」「Bill One」「Contract One」等の当社が提供するサービスでは、機械学習等によって進化するAIテクノロジーと人による手入力の組み合わせによって、アナログ情報のデジタル化を行っています。現在、OCRによる自動デジタル化技術が普及しているものの、どのようなOCRを用いても99.9%の精度を実現することはできず、AIによる機械学習や人による手入力によりデータ化精度を補完する必要があります。当社グループでは、研究開発部門でのAI技術研究や国内外に数十万人以上いるオペレーター体制によって、大量のアナログ情報を早く、そして低コストでデータ化するフローを実現しています。

 

名刺データ化の仕組みとオペレーション

創業から磨き込みを続けるサービスのUI/UX

創業から磨き込みを続けるサービスのUI/UX

当社グループは2007年の創業から、法人向け名刺管理サービス市場を自ら創り上げ、当該市場で82.4%の高いシェア*を有するパイオニアとして、市場をリードしています。サービスを開始して以降、さまざまな独自の構想や利用ユーザーからのフィードバック等を基に、日々、利便性向上や機能の拡充等に取り組んでいます。現在では、名刺管理機能に留まらず、企業の全社員での利用を想定したビジネスプラットフォームとして、さまざまな機能を「Sansan」上でスムーズに体験できるUI/UXを実現しています。

 

*営業支援DXにおける名刺管理サービスの最新動向2024(2024年1月 シード・プランニング調査)

盤石な顧客基盤

盤石な顧客基盤

 

サービス開始当初は、中小企業の利用が中心でしたが、マーケティング活動等に注力するにつれて、徐々に大企業での利用も拡大しました。社会的に、より高いセキュリティが求められる金融機関での導入も進む等、業界、業種を問わない盤石な顧客基盤を構築しています。

名刺のデータ化フロー

名刺のデータ化フロー

 

1 スキャン・撮影

ユーザーが専用のスキャナやスマートフォンのアプリケーションで名刺をスキャン・撮影すると、取り込まれた名刺画像が当社に送付されます。

 

2 画像処理

名刺画像は、画像処理技術によって背景処理がなされ、文字を際立たせるホワイトニング等の画像補正処理によって文字が読み取りやすい状態へと加工されます。

 

3 名刺項目の分類

名刺上の文字のかたまりを機械による完全自動化で分割した後、会社名・姓名・肩書き・メールアドレス・会社のロゴといった項目毎の分類を実施します。

 

4 分類した名刺情報の切片化

セキュリティに配慮し、姓名や電話番号、メールアドレス等を含む画像は、情報として価値が無くなるまで切片化します。

 

5 データ入力

・機械による自動入力

切片化したそれぞれの項目を機械処理によって自動にデータ入力を行います。機械による自動入力で確定できなかった場合には、人による手動入力にて入力を行います。

 

・人による手動入力

入力過程においては、入力ミスを防ぐために2人以上のオペレーターによって同じ画像の入力を行い、その結果が合致するまで入力工程を行うことでデータ化精度を高めています。人による手入力の場合には、国内外数十万人以上のオペレーターが作業工程に携わっており、大量の名刺を即座にデータ化するフロー実現しています。

 

・AI技術を用いた入力データの補完

分割されたデータを1つの名刺情報に集約した後に、人による入力の間違いには一定の規則性があることから、AIでの深層学習等を用いて解析し、データ化精度を補完しています。そのほか、AI技術によって、文字の言語判定や会社ロゴの抽出、顔写真の判定等を行い、あらゆるデザイン、文字形式であっても高い精度でデータ化できるフローを磨き上げています。