Ocr Pdf Extractor

Pricing

from $2.00 / 1,000 results

Ocr Pdf Extractor

Extract text from images and PDFs using OCR. Supports multiple languages including English, Portuguese, Spanish, French, German. Uses Tesseract OCR engine with high accuracy text extraction and word-level confidence scores.

Pricing

from $2.00 / 1,000 results

Rating

0.0

(0)

Developer

👁 Fabio Suizu

Fabio Suizu

Maintained by Community

Actor stats

Bookmarked

Total users

Monthly active users

5 months ago

Last modified

OCR & PDF Text Extractor

Extract text from images and PDFs with OCR. Support for 12+ languages, form extraction, and table detection. Powered by Azure AI.

Features

Fast Processing: Lightning-fast ocr & pdf text extractor powered by Azure
Reliable: 99.9% uptime with automatic failover
Scalable: Handle single requests or bulk operations
Secure: Enterprise-grade security with API key authentication
Well Documented: Comprehensive API documentation and examples

Use Cases

E-commerce: Process product images at scale
Media: Automate image processing pipelines
Apps: Add image processing to your applications

Input Parameters

Parameter	Type	Required	Description
`fileUrl`	string	No	URL to download image or PDF
`fileUrls`	array	No	Array of URLs for bulk extraction
`language`	string	No	OCR language code
`backend`	string	No	OCR engine to use
`extractForms`	boolean	No	Extract form fields (key-value pairs)
`mode`	string	No	Extraction mode

Output Format

{
"success":true,
"result":{ ... },
"timestamp":"2026-01-07T00:00:00Z"
}

Code Examples

JavaScript (Node.js)

import{ ApifyClient }from'apify-client';
const client =newApifyClient({token:'YOUR_API_TOKEN'});
const input ={
"fileUrl":"example_fileUrl",
"fileUrls":[],
"language":"eng",
"backend":"auto",
"extractForms":false,
"mode":"single"
};
const run =await client.actor("vivid_astronaut/ocr-api").call(input);
const{ items }=await client.dataset(run.defaultDatasetId).listItems();
console.log(items);

Python

from apify_client import ApifyClient
client = ApifyClient("YOUR_API_TOKEN")
run_input ={
"fileUrl":"example_fileUrl",
"fileUrls":[],
"language":"eng",
"backend":"auto",
"extractForms": false,
"mode":"single"
}
run = client.actor("vivid_astronaut/ocr-api").call(run_input=run_input)
for item in client.dataset(run["defaultDatasetId"]).iterate_items():
print(item)

cURL

curl-X POST "https://api.apify.com/v2/acts/vivid_astronaut~ocr-api/runs?token=YOUR_API_TOKEN"\
-H"Content-Type: application/json"\
-d'{
 "fileUrl": "example_fileUrl",
 "fileUrls": [],
 "language": "eng",
 "backend": "auto",
 "extractForms": false,
 "mode": "single"
}'

Pricing

Model: Pay per result Price: $0.020 per result

You only pay for successful results. Platform usage costs are included.

API Documentation

Full API documentation is available at:

Support

Issues: Report bugs via Apify Console
Documentation: Apify Docs
Community: Apify Discord

Version History

See ./CHANGELOG.md for version history.

Powered by Azure Cloud Infrastructure

👁 Image to Text (OCR) — Extract Text from Screenshots & Photos avatar

Image to Text (OCR) — Extract Text from Screenshots & Photos

junipr/image-to-text

Extract text from images using Tesseract.js OCR engine. Supports 100+ languages, PDFs, and bulk image processing.

👁 User avatar

junipr

Image OCR — Extract Text from Images

zenomastro/image-ocr-text-extractor

Extract text from images, photos, screenshots and scans using Tesseract OCR. Returns recognized text with a confidence score. Supports many languages.

👁 User avatar

Rosario Vitale

👁 OCR Structured Extractor (AI) — Image/PDF → OCR Text + JSON avatar

OCR Structured Extractor (AI) — Image/PDF → OCR Text + JSON

macheta/ocr-structured-extractor

Extract OCR text and structured JSON from an image or PDF URL. Great for invoices, receipts, forms, IDs, and tables. Powered by Gemini 3 Pro.

👁 User avatar

Anass

Ocr

vivid_astronaut/ocr

Extract text from images using advanced OCR technology. Supports multiple languages and image formats. Perfect for digitizing documents, receipts, screenshots, and scanned text.

👁 User avatar

Fabio Suizu

👁 PDF OCR Tool — Extract Text from Scanned Documents avatar

PDF OCR Tool — Extract Text from Scanned Documents

junipr/pdf-ocr-tool

Extract text from scanned PDFs and images using Tesseract OCR. 100+ languages, multi-page support. Configurable DPI, page segmentation, language selection. Output as plain text or structured JSON per page.

👁 User avatar

junipr

👁 PDF OCR API - Document Extraction avatar

PDF OCR API - Document Extraction

alizarin_refrigerator-owner/pdf-ocr-api

Extract text from PDFs including scanned documents. OCR processing, table extraction & structured data output. Process invoices, contracts & forms at scale.

👁 User avatar

The Howlers

👁 Bulk Pdf To Json OCR avatar

Bulk Pdf To Json OCR

gagandeo/bulk-pdf-to-json-ocr

Convert PDF invoices, menus, images with text and documents into structured JSON. Features hybrid Digital+OCR parsing and AI-powered data extraction.

👁 User avatar

Kumar Gagandeo

👁 Receipt OCR API avatar

Receipt OCR API

happitap/receipt-ocr-api

Receipt OCR API - Multi-Model Text Extraction : Extract structured data from receipt images using advanced OCR technology with support for multiple AI models including Google Vision, OpenAI, Azure, AWS Textract, Gemini, Hugging Face, DeepSeek, and Native OCR.

👁 User avatar

HappiTap

5.0

Passport Ocr API

vivid_astronaut/passport-ocr

👁 User avatar

Fabio Suizu

Receipt Ocr API

vivid_astronaut/receipt-ocr

👁 User avatar

Fabio Suizu

URL: https://apify.com/vivid_astronaut/ocr-pdf-extractor

⇱ OCR PDF Text Extractor - 12+ Languages · Apify

Ocr Pdf Extractor

OCR & PDF Text Extractor

Features

Use Cases

Input Parameters

Output Format

Code Examples

JavaScript (Node.js)

Python

cURL

Pricing

API Documentation

Support

Version History

You might also like

Image to Text (OCR) — Extract Text from Screenshots & Photos

Image OCR — Extract Text from Images

OCR Structured Extractor (AI) — Image/PDF → OCR Text + JSON

Ocr

PDF OCR Tool — Extract Text from Scanned Documents

PDF OCR API - Document Extraction

Bulk Pdf To Json OCR

Receipt OCR API

Passport Ocr API

Receipt Ocr API