VOOZH about

URL: https://products.groupdocs.cloud/ja/parser/java/

⇱ Java Cloud SDK |パーサーRESTAPI|データ抽出


RESTAPIとJavaSDKを使用した解析と抽出

請求書、領収書、財務表などのドキュメントを解析して、40以上の一般的なドキュメント形式からテキスト、画像、メタデータを抽出します。

無料トライアルを開始

👁 GroupDocs.Parser Cloud SDK for Java
GroupDocs.Parser
Cloud SDK ために Java

GitHub 学び 買う

GroupDocs.Parser Cloud for Javaは、50を超えるドキュメントタイプを解析するためのドキュメントデータ抽出RESTAPIのラッパーです。事前定義されたテンプレートを使用したドキュメントの解析は、GroupDocs.ParserCloudAPIの最も価値のある機能の1つです。テンプレートを定義し、請求書やその他の種類の一般的なドキュメントからデータを抽出するのは非常にシンプルで簡単です。 APIは、ほとんどすべての最も一般的なファイル形式から画像を抽出し、テキストとメタデータを抽出するメソッドを提供します。通常のドキュメントに加えて、パスワードで保護されたファイルや、JavaアプリケーションのZIPアーカイブ、OST / PSTメールデータファイル、電子書籍、マークアップ、PDFポートフォリオなどのコンテナでサポートされている機能を使用できます。


  • 一目
  • サポートされています
    ファイル形式
  • プラットホーム
    独立

ドキュメントパーサーCloudAPIでサポートされている機能の概要。‎

*ドキュメントを解析する *テンプレートごとにドキュメントを解析する *テキストを抽出する *画像を抽出する *メタデータを抽出する

*メール *電子書籍 *PDFファイル *PDFポートフォリオ *ZIPアーカイブ内のファイル *テキストおよびマークアップドキュメント

  • Microsoft&OpenDocument

ドキュメントパーサーCloudAPIでサポートされている形式。

  • ワードプロセッシング:DOC、DOCX、DOCM、DOT、DOTX、DOTM
  • スプレッドシート:XLS、XLSX、XLSM、XLSB、XLT、XLTX、XLTM、XLA、XLAM
  • プレゼンテーション:PPT、PPTX、PPTM、PPS、PPSX、PPSM、POT、POTX、POTM
  • ** OneNote **:ONE
  • ** OpenDocument形式**:ODT、OTT、ODS、OTS、ODP、OTP
  • テキスト:TXT、RTF
  • マークアップ:HTML、XHTML、MHTML、MD、XML
  • ポータブルフォーマット:PDF
  • メール:PST、OST、EML、EMLX、MSG
  • ** eBook形式**:EPUB、FB2、CHM
  • その他:数字、CSV、ZIP

サポートされているオペレーティングシステムとフレームワーク

よくある質問

オンラインでファイルを解析できる独自の Java アプリケーションを作成したいですか?

クラウドでファイルを解析するためのソース コードを探している場合は、GitHub で Java 用のクラウド SDK を確認してください。

Java で GroupDocs.Parser REST API を無料で試すことはできますか?

GroupDocs.Parser を試す ローコード Java API を制限なく使用できます。

機密ファイルをどこにもアップロードしたくありませんか?私のオプションは何ですか?

GroupDocs.Parser Cloud は、サービスを セルフホスト するために使用できる Docker イメージとしても利用できます。または、GroupDocs.Parser ハイコード API を使用して独自のサービスを構築することもできます。これは現在、無料アプリと REST API の両方を駆動しています。

ドキュメントパーサーRESTAPIの機能

PDF、ワードプロセッシングドキュメント、スプレッドシート、プレゼンテーションを解析する

Microsoft Word、Excel、PowerPoint、OpenDocumentテンプレートファイルを解析します

MS Word、Excel、PowerPoint用のマクロ対応のドキュメントとテンプレートを解析する

ドキュメント全体からテキストコンテンツを抽出する

特定のページからテキストと画像を抽出する

抽出モードを設定してフォーマットされたテキストを抽出する

ZIPアーカイブまたは電子メールのドキュメントからテキストを抽出します

電子メール、PDFポートフォリオ、およびMSOutlookストレージからドキュメントを取得します

ドキュメントのページ数やその他の情報を取得する

ドキュメントから画像を抽出する

GroupDocs.Parser Cloud APIは、ドキュメントから画像を抽出するいくつかの方法を提供します。ページ範囲を設定することで、ドキュメント全体からすべての画像を抽出したり、特定のページから画像を抽出したりできます。次の例は、コンテナ内のドキュメントから画像を抽出する方法を示しています。

PDFポートフォリオから画像を抽出する-Java

// Get AppKey and AppSID from https://dashboard.groupdocs.cloud
String MyAppKey = "";
String MyAppSid = "";
Configuration configuration = new Configuration(MyAppSid, MyAppKey);
ParseApi apiInstance = new ParseApi(configuration);
FileInfo fileInfo = new FileInfo();
fileInfo.setFilePath("pdf/PDF with attachments.pdf");
fileInfo.setPassword("password");
ContainerItemInfo containerItemInfo = new ContainerItemInfo();
containerItemInfo.setRelativePath("template-document.pdf");
ImagesOptions options = new ImagesOptions();
options.setFileInfo(fileInfo);
options.setContainerItemInfo(containerItemInfo);
ImagesRequest request = new ImagesRequest(options);
ImagesResult response = apiInstance.images(request);
// For complete examples and data files, visit https://github.com/groupdocs-parser-cloud/groupdocs-parser-cloud-java-samples

GroupDocs.Parser 無料アプリを使用してドキュメントから画像を抽出する

JP2PPTXZIPXLSTIFFDOTXONEDOTPOTODTPPTPPSMPPSXPDFXLSBRTFDOCXLTMBMPPOTMMHTMLGIFTIFXLTXDOTMXMLPPTMEPUBOTTXHTMLGZJPEGPSTCHMEMLPOTXXLAOSTTARXLAMPNGFB2MSGJPGDOCXOTPXLSXMDEMLXBZ2CSVXLSMRARPPSOTSODSDOCMXLTODPTXTHTML

GroupDocs.Parser 無料アプリを使用してドキュメントから画像を抽出する

MHTMLTIFFMSGDOTMPPSPPSMBZ2CSVXLTXLSODTGIFPOTXRTFRARODPPDFPOTMPPTOTTDOCMPPTMFB2XLAPSTDOTPOTXLSXOTSBMPXLAMXMLEMLTIFJPEGPPTXJPGMDOSTOTPXLSMDOTXEMLXPNGXLSBEPUBODSXHTMLHTMLTXTXLTMONEJP2ZIPTARCHMXLTXPPSXDOCXDOCGZ

サポートと学習リソース

無料トライアルを開始
GitHub リポジトリをダウンロード

GroupDocs.Parser Cloudは、以下に示すように、他の言語用の個別のドキュメント解析SDKも提供します。

👁 GroupDocs.Parser Cloud for cURL
GroupDocs.Parser
Cloud ために cURL

👁 GroupDocs.Parser Cloud SDK for .NET
GroupDocs.Parser
Cloud SDK ために .NET

👁 GroupDocs.Parser Cloud SDK for PHP
GroupDocs.Parser
Cloud SDK ために PHP

👁 GroupDocs.Parser Cloud SDK for Python
GroupDocs.Parser
Cloud SDK ために Python

👁 GroupDocs.Parser Cloud SDK for Ruby
GroupDocs.Parser
Cloud SDK ために Ruby

👁 GroupDocs.Parser Cloud SDK for Node.js
GroupDocs.Parser
Cloud SDK ために Node.js