Wikipedia Article Scraper

Pricing

from $0.50 / 1,000 results

Wikipedia Article Scraper

Extract structured data from Wikipedia articles. Get summaries, categories, images, metadata, and descriptions using Wikipedia's official API. Supports 300+ languages.

Pricing

from $0.50 / 1,000 results

Rating

0.0

(0)

Developer

👁 Crawler Bros

Crawler Bros

Maintained by Community

Actor stats

Bookmarked

Total users

Monthly active users

2 months ago

Last modified

Features

Extract article titles, summaries, and descriptions
Get categories, images, and thumbnails
Support for 300+ Wikipedia languages
Two modes: scrape by URL or search by keyword
Uses official Wikipedia REST + MediaWiki APIs
No proxy or cookies required
Lightweight HTTP-only (no browser)
Proper rate limiting and User-Agent identification

Input

Field	Type	Default	Description
`articleUrls`	Array	—	Wikipedia article URLs to scrape
`searchQueries`	Array	—	Search terms to find articles
`maxArticlesPerQuery`	Integer	5	Max articles per search query (1-50)
`language`	String	"en"	Wikipedia language code

Example: Scrape by URL

{
"articleUrls":[
"https://en.wikipedia.org/wiki/Python_(programming_language)",
"https://en.wikipedia.org/wiki/Artificial_intelligence"
]
}

Example: Search by Keyword

{
"searchQueries":["machine learning","quantum computing"],
"maxArticlesPerQuery":3,
"language":"en"
}

Output

Field	Type	Description
`title`	String	Article title
`url`	String	Full Wikipedia URL
`summary`	String	Lead section extract (first few paragraphs)
`description`	String	Wikidata short description
`categories`	Array	Article categories
`thumbnail`	Object	Thumbnail image with source, width, height
`images`	Array	Image filenames from the article
`lastModified`	String	Last edit timestamp
`language`	String	Language code
`pageId`	Integer	Wikipedia page ID
`scrapedAt`	String	ISO timestamp when scraped

Use Cases

Research — collect structured article data for academic or business research
Content enrichment — augment your database with Wikipedia descriptions and metadata
Knowledge graphs — build knowledge bases from Wikipedia's categorized data
Education — gather article summaries for educational content
SEO — analyze Wikipedia's coverage of topics in your niche
Data science — use Wikipedia data for NLP training and analysis

FAQ

Is a proxy required?

No. Wikipedia's API is freely accessible. No proxy, cookies, or authentication needed.

What languages are supported?

All 300+ Wikipedia language editions. Set the language parameter to any valid code: en, fr, de, es, ja, zh, ru, pt, it, ar, ko, nl, pl, etc.

Are there rate limits?

Wikipedia asks for polite access with proper User-Agent headers. The scraper includes built-in delays (0.3-0.5s between requests) to respect Wikipedia's guidelines.

Can I scrape article content (full text)?

This scraper extracts the lead section summary. For full article text, the summary field contains a clean text extract of the opening paragraphs which is suitable for most use cases.

Wikipedia Article Scraper

cloud9_ai/wikipedia-scraper

Scrape Wikipedia articles by search keyword or exact title. Returns summaries, full article text, categories, and links. Supports 300+ languages.

👁 User avatar

cloud9

Wikipedia Data Extractor - Articles & Summaries

vernacular_reservoir/wikipedia-data-extractor

Extract structured data from Wikipedia articles by topic or keyword. Get title, summary, description, thumbnail, coordinates and related links. Supports all Wikipedia languages. No API key required.

👁 User avatar

Aleksandrs

Wikipedia Scraper

velvety_bedbug/wikipedia-scraper

Search Wikipedia articles, fetch article content and summaries, or get today's featured and most-read articles. Supports all Wikipedia language editions.

👁 User avatar

Peters Bugs

👁 Wikipedia Scraper avatar

Wikipedia Scraper

automation-lab/wikipedia-scraper

Search and extract Wikipedia articles — titles, summaries, full content, categories, and images. Uses the free MediaWiki API.

👁 User avatar

Stas Persiianenko

👁 Wikipedia Scraper avatar

Wikipedia Scraper

gio21/wikipedia-scraper

Search Wikipedia and return article summaries or full text via the public REST API. Supports 300+ languages. Useful for knowledge extraction, research, content generation, and entity enrichment.

👁 User avatar

Gio

👁 Wikipedia Article Scraper avatar

Wikipedia Article Scraper

rupom888/wikipedia-article-scraper

Scrape Wikipedia articles using the official MediaWiki REST API. Search by keyword, look up specific titles, or scrape by URL. Extracts full article text, sections, infobox data, categories, references, images, and related articles. Supports 300+ languages.

👁 User avatar

Syed Rupom

Wikipedia Article Extractor

glassventures/wikipedia-article-extractor

Extract Wikipedia articles via MediaWiki API. Get full text, summaries, sections, categories, images, links. Multi-language. Perfect for AI/ML training data and RAG.

👁 User avatar

Glass Ventures

Wikipedia Article Extractor (AI-ready)

changeable_acacia/wikipedia-article-extractor-ai-ready

Extracts clean JSON from any Wikipedia article for AI/RAG use.

👁 User avatar

SABYASACHI TRIPATHY

Wikipedia Scraper

oneary/wikipedia-scraper

Extract article content, summaries, infoboxes, references, and categories from Wikipedia. Great for knowledge base building and research.

👁 User avatar

Luan M.

Wikipedia Scraper - Article Content Extractor

lulzasaur/wikipedia-scraper

Scrape Wikipedia articles. Search by topic and extract full structured content: summaries, sections, infobox data, categories, references, images, and edit history for any article.

👁 User avatar

lulz bot

👁 Blog article image

How to scrape Wikipedia with Python

URL: https://apify.com/crawlerbros/wikipedia-scraper

⇱ Wikipedia Article Scraper · Apify

Wikipedia Article Scraper

Features

Input

Example: Scrape by URL

Example: Search by Keyword

Output

Use Cases

FAQ

Is a proxy required?

What languages are supported?

Are there rate limits?

Can I scrape article content (full text)?

You might also like

Wikipedia Article Scraper

Wikipedia Data Extractor - Articles & Summaries

Wikipedia Scraper

Wikipedia Scraper

Wikipedia Scraper

Wikipedia Article Scraper

Wikipedia Article Extractor

Wikipedia Article Extractor (AI-ready)

Wikipedia Scraper

Wikipedia Scraper - Article Content Extractor

Related articles