👁 Wikipedia Article Scraper - Search & Extract Content avatar

Wikipedia Article Scraper - Search & Extract Content

Pricing

$1.00 / 1,000 article extracteds

👁 Wikipedia Article Scraper - Search & Extract Content

Wikipedia Article Scraper - Search & Extract Content

Search and extract Wikipedia article metadata, summaries, and content via the official MediaWiki API. No scraping overhead — pure API integration with high reliability.

Pricing

$1.00 / 1,000 article extracteds

Rating

0.0

(0)

Developer

👁 Pierrick McD0nald

Pierrick McD0nald

Maintained by Community

Actor stats

Bookmarked

Total users

Monthly active users

a month ago

Last modified

Wikipedia Article Scraper — Search & Extract Content

Extract Wikipedia article metadata, summaries, and content via the official MediaWiki API. This Actor searches Wikipedia by keyword and returns structured data for every matching article — no browser overhead, no scraping complexity, just clean API integration.

Use Cases

Content Research — Gather article summaries and metadata for academic research, content marketing, or knowledge base building.
SEO & Topic Analysis — Extract word counts, article sizes, and publication dates to analyze content depth and freshness across topics.
Data Enrichment — Augment datasets with Wikipedia summaries, thumbnail images, and canonical URLs for entity linking and NLP pipelines.
Multilingual Content — Search across 300+ Wikipedia language editions to build localized content collections.

Input

Field	Type	Required	Description
`searchQuery`	String	Yes	Search term to find Wikipedia articles (e.g., "machine learning", "quantum computing")
`maxResults`	Number	No	Maximum articles to extract, 1–500 (default: 25)
`includeExtract`	Boolean	No	Fetch article introduction/summary text (default: true)
`includeImages`	Boolean	No	Fetch thumbnail image URLs (default: false)
`language`	String	No	Wikipedia language code: en, es, fr, de, ja, etc. (default: "en")
`proxyConfiguration`	Object	No	Proxy settings (optional — Wikipedia API does not require proxy)

Output

The Actor outputs a dataset with the following fields:

{
"pageId":233488,
"title":"Machine learning",
"url":"https://en.wikipedia.org/wiki/Machine_learning",
"snippet":"Machine learning (ML) is a field of study in artificial intelligence...",
"extract":"Machine learning (ML) is a field of study in artificial intelligence concerned with the development and study of statistical algorithms...",
"wordCount":15287,
"size":141291,
"thumbnail":"https://upload.wikimedia.org/wikipedia/commons/thumb/...",
"timestamp":"2026-05-15T10:30:00Z",
"language":"en"
}

Pricing

Pay per event: $0.001 per article extracted.

No minimums, no subscriptions. You only pay for the results you receive. The Wikipedia MediaWiki API is free and public, so compute costs are minimal and margins stay high.

Limitations

Maximum 500 results per run (Wikipedia API limit)
Article extracts are limited to the introduction/summary section
Thumbnail images are only available when includeImages is enabled and the article has an image
Rate limits apply per Wikipedia language edition (handled automatically with retries)

FAQ

Q: Do I need a Wikipedia API key? A: No. This Actor uses the public MediaWiki API with no authentication required.

Q: Can I search in languages other than English? A: Yes. Set the language field to any valid Wikipedia language code (e.g., "es" for Spanish, "ja" for Japanese).

Q: What happens if my search returns thousands of results? A: The Actor respects the maxResults limit and paginates through the API automatically. You only pay for the number of articles actually extracted.

Changelog

v1.0.0 — Initial release

👁 Wikipedia Scraper avatar

Wikipedia Scraper

automation-lab/wikipedia-scraper

Search and extract Wikipedia articles — titles, summaries, full content, categories, and images. Uses the free MediaWiki API.

👁 User avatar

Stas Persiianenko

👁 Wikipedia Article Scraper avatar

Wikipedia Article Scraper

crawlerbros/wikipedia-scraper

Extract structured data from Wikipedia articles. Get summaries, categories, images, metadata, and descriptions using Wikipedia's official API. Supports 300+ languages.

👁 User avatar

Crawler Bros

Wikipedia Article Extractor

glassventures/wikipedia-article-extractor

Extract Wikipedia articles via MediaWiki API. Get full text, summaries, sections, categories, images, links. Multi-language. Perfect for AI/ML training data and RAG.

👁 User avatar

Glass Ventures

Wikipedia Scraper - Article Content Extractor

lulzasaur/wikipedia-scraper

Scrape Wikipedia articles. Search by topic and extract full structured content: summaries, sections, infobox data, categories, references, images, and edit history for any article.

👁 User avatar

lulz bot

Wikipedia Article Scraper

cloud9_ai/wikipedia-scraper

Scrape Wikipedia articles by search keyword or exact title. Returns summaries, full article text, categories, and links. Supports 300+ languages.

👁 User avatar

cloud9

Wikipedia Article Extractor (AI-ready)

changeable_acacia/wikipedia-article-extractor-ai-ready

Extracts clean JSON from any Wikipedia article for AI/RAG use.

👁 User avatar

SABYASACHI TRIPATHY

Wikipedia Scraper

velvety_bedbug/wikipedia-scraper

Search Wikipedia articles, fetch article content and summaries, or get today's featured and most-read articles. Supports all Wikipedia language editions.

👁 User avatar

Peters Bugs

👁 Wikipedia Scraper avatar

Wikipedia Scraper

gio21/wikipedia-scraper

Search Wikipedia and return article summaries or full text via the public REST API. Supports 300+ languages. Useful for knowledge extraction, research, content generation, and entity enrichment.

👁 User avatar

Gio

Wikipedia Scraper

oneary/wikipedia-scraper

Extract article content, summaries, infoboxes, references, and categories from Wikipedia. Great for knowledge base building and research.

👁 User avatar

Luan M.

👁 Wikipedia Article Scraper avatar

Wikipedia Article Scraper

rupom888/wikipedia-article-scraper

Scrape Wikipedia articles using the official MediaWiki REST API. Search by keyword, look up specific titles, or scrape by URL. Extracts full article text, sections, infobox data, categories, references, images, and related articles. Supports 300+ languages.

👁 User avatar

Syed Rupom

URL: https://apify.com/klondikeking/wikipedia-article-scraper

⇱ Wikipedia Article Scraper - Search & Extract Content · Apify

Wikipedia Article Scraper - Search & Extract Content

Wikipedia Article Scraper — Search & Extract Content

Use Cases

Input

Output

Pricing

Limitations

FAQ

Changelog

You might also like

Wikipedia Scraper

Wikipedia Article Scraper

Wikipedia Article Extractor

Wikipedia Scraper - Article Content Extractor

Wikipedia Article Scraper

Wikipedia Article Extractor (AI-ready)

Wikipedia Scraper

Wikipedia Scraper

Wikipedia Scraper

Wikipedia Article Scraper