マニュアル検索システムとは
強力な検索機能で、欲しい情報がすぐに見つけられるようになります。
企業や団体が業務で利用している基幹システム内の様々な書類や文書(契約書、マニュアル、資料など)をデジタル化したうえで検索性を高めるためのシステムです。
検索性の向上だけでなく、マルチメディア・データベースが構築にも繋がり、様々な面での業務効率化が見込めます。
Word・Excel・PowerPoint・PDF等のファイルの中身を全文検索可能。
キーワードを入力すれば、ほしい情報にダイレクトにアクセスできる様々な検索(フリーワード検索機能/サジェスション機能/ファセット(ドリルダウン)/類義語検索機能/形態素解析機能)機能を用意しています。
システム全体概要
- マニュアルのみならず、あらゆる素材を取込んで統合的マルチメディアデータベースを構築
- マニュアル、契約書等の全文ワードをベースとした様々な条件で高速に検索
- ファセット検索(ドリルダウン)機能キーワード入力サジェスト機能、類語同義語辞書機能
- PC&スマホ&タブレットの利用を前提とした、レスポンシブWEB画面
機能一覧
分類 | 機能名称 | 静的/動的 | 補足 |
認証 | ログイン | 動的 | ユーザ情報の連携は要検討 |
用語検索 | 日本語サジェスション機能 | 動的 | かな入力による即時用語表記 選択即本文表示 |
キーワード検索機能 | 動的 | 複数キーワード入力による全文検索 検索結果は一覧上でハイライト表示 | |
ファセット・ドリルダウン機能 | 動的 | 分類別にヒット件数表示 ドリルダウンにより更に絞り込み検索 | |
検索結果一覧 | ドキュメント検索結果一覧 | 動的 | ドキュメント検索結果一覧 ランキング/かな順ソートが可能 |
本文 | PDF表示 | 動的 | PDFViewerにてドキュメントを表示 |
取込機能 | テキストPDFデータ抽出 | 動的 | テキスト付PDFからテキスト抽出 |
OCR事前データ補正 | 動的 | OCR精度向上の為の補正処理 | |
OCR解析 | 動的 | OCR製品の選定/及びOCR抽出機能 | |
ADMIN機能 | 類義語辞書ダウンロード/アップロード | 動的 | 類義語辞書登録用 |
マスタメンテナンス | 動的 | 管理情報・各種マスタ | |
バックアップ/リストア | バッチ | 障害対応用 |
検索方式 用語とフリーワード
【サジェスション検索】
用語文字列を1字ずつ入力することで、当該用語をサジェスション方式でプルダウン表示させる。これらマウス選択により直接本文画面がポップアップ形式で表示することが出来る。本文中には関連語リンクが張られ、こちらを選択することで複数の本文の表示が可能となる。(本文外字表記も可能)
【フリーワード検索】
フリーワード文字列を複数入力することで、本文中に含まれるワードより全文検索を実施しランキング(検索HIT率)により一覧を表示する。一覧から対象用語を選択することで、本文詳細が表示される。また、一覧ではランキングの他に、かな文字による昇順、降順ソート( )が出来る。
また、フリーワード検索の際、別途用意する類語同義語辞書、異体字辞書により、広く検索を実施することが可能となる。
更に、論理和(OR)/論理積(AND) /否定(NOT)とした詳細検索も可能となる。
【形態素解析検索】
検索対象文章を形態素解析を行い、単語に分ける事で精度の高い検索を実現します。
たとえば「京都」で検索すると、完全一致検索では、検索されるのが「東京都」ばかりになる可能性がありますが、形態素解析を行う事により、「京都」という単語のみ検索する事が可能です。
検索方式 拡張機能オプション
■フリーワード検索を実施する際、下記の各要素に対し拡張検索を用意します。
【ファセット機能】
左ペインに分類毎のヒット件数を表示する事で、どの様な分類の文書がヒットしたのか分かります。
また分類を更に絞り込んでゆく事で(ドリルダウン機能)、対象の文書を特定できます。
【ハイライト・要約機能】
類語同義語を含むヒットしたワードをハイライトで表示します。またヒットしたワードの前後の文字を要約して表示します。
OCR文字認識精度向上策
テキスト付PDFの場合、検索用データはそのままテキストを使用します。
テキストの無いイメージデータのPDFの場合、OCR解析を行い、文字データに変換する必要があります。
OCRの製品は、無償のものから有償のものまで様々な製品がありますが、入力元になる画像データの内容により、読取精度に差異が出ます。(手書き、縦書き、フォント、表中の文字、文字サイズの不均衡などが影響します。)
弊社では、以下の様に様々なOCRの経験から、入力元のデータにあったOCR製品を提案致します。
NO | 会社 | 商品 | 分類 |
1 | Panasonic | 読取革命 | ルールベース |
2 | エヌジェーケー | e.Typist | ルールベース |
3 | Panasonic | 帳票OCR | AI機能ベース |
4 | NEC | N6370E | AI機能ベース |
5 | 百度 | 百度OCR | AI機能ベース |
6 | Google Cloud Vision API | AI機能ベース |
事前に入力元サンプルを提供して頂き、OCR解析結果をご報告する事は可能です。
また事前にノイズや背景を除去する事により、検索精度が高まる事も分かっておりますので、入力データやOCR製品に併せて対応致します。
お問い合わせ
自社のシステムでどのように活用できるか詳しく知りたい方はお気軽にお問い合わせください。
担当者から改めてご連絡させていただきます。