VOOZH about

URL: https://apify.com/jahrim/github-user-info-scraper

⇱ GitHub User & Repository Info Scraper · Apify


👁 GitHub User & Repository Info Scraper avatar

GitHub User & Repository Info Scraper

Pricing

Pay per usage

Go to Apify Store

GitHub User & Repository Info Scraper

Récupère le profil public, les dépôts, les organisations et (optionnellement) les dépôts starrés pour un ou plusieurs utilisateurs GitHub, via l'API officielle GitHub.

Pricing

Pay per usage

Rating

0.0

(0)

Developer

👁 Valisoa Mirija

Valisoa Mirija

Maintained by Community

Actor stats

0

Bookmarked

2

Total users

1

Monthly active users

8 days ago

Last modified

Share

Cet actor récupère, pour une liste d'utilisateurs ou d'organisations GitHub, leur profil public complet, leurs dépôts, leurs organisations d'appartenance et (optionnellement) leurs dépôts starrés. Les données proviennent directement de l'API officielle GitHub (pas de scraping HTML), ce qui garantit des résultats fiables et conformes aux conditions d'utilisation de GitHub.

Input

ChampTypeDescription
usernamesarray (requis)Liste de logins GitHub (utilisateurs ou organisations) à interroger
githubTokenstring (secret)Token d'accès personnel GitHub. Sans token : 60 requêtes/heure. Avec token : 5000 requêtes/heure
includeRepositoriesbooleanRécupère la liste des dépôts publics de chaque utilisateur (défaut : true)
includeOrganizationsbooleanRécupère les organisations auxquelles chaque utilisateur appartient (défaut : true)
includeStarredReposbooleanRécupère la liste des dépôts mis en favori (starred) par chaque utilisateur (défaut : false)
maxItemsPerEndpointintegerNombre maximum d'éléments à récupérer par endpoint paginé (dépôts, organisations, starred) pour chaque utilisateur (défaut : 100, max : 1000)

Comment créer un token GitHub

Settings → Developer settings → Personal access tokens → Generate new token (fine-grained ou classic). Aucun scope particulier n'est nécessaire pour des données publiques ; un token sans scope suffit à débloquer la limite de 5000 requêtes/heure au lieu de 60.

Output

Chaque utilisateur produit un item dans le dataset par défaut. Structure complète :

{
"profile":{
"login":"torvalds",
"id":1024025,
"node_id":"MDQ6VXNlcjEwMjQwMjU=",
"avatar_url":"https://avatars.githubusercontent.com/u/1024025?v=4",
"html_url":"https://github.com/torvalds",
"type":"User",
"site_admin":false,
"name":"Linus Torvalds",
"company":"Linux Foundation",
"blog":"",
"location":"Portland, OR",
"email":null,
"hireable":null,
"bio":null,
"twitter_username":null,
"public_repos":12,
"public_gists":1,
"followers":307935,
"following":0,
"created_at":"2011-09-03T15:26:22Z",
"updated_at":"2026-06-17T17:35:14Z"
},
"repositories":[
{
"id":2325298,
"name":"linux",
"full_name":"torvalds/linux",
"private":false,
"html_url":"https://github.com/torvalds/linux",
"description":"Linux kernel source tree",
"fork":false,
"created_at":"2011-09-04T22:48:12Z",
"updated_at":"2026-06-18T14:28:15Z",
"pushed_at":"2026-06-17T19:39:08Z",
"homepage":"",
"size":6195147,
"stargazers_count":236849,
"watchers_count":236849,
"language":"C",
"forks_count":62758,
"archived":false,
"disabled":false,
"open_issues_count":3,
"license":{"key":"other","name":"Other"},
"topics":[],
"visibility":"public",
"default_branch":"master"
}
],
"organizations":[
{
"login":"nom-organisation",
"id":123456,
"avatar_url":"https://avatars.githubusercontent.com/u/123456?v=4",
"description":"Description de l'organisation"
}
],
"starredRepositories":[]
}

Champs du profil

ChampDescription
loginNom d'utilisateur GitHub
id / node_idIdentifiants uniques GitHub (utile pour déduplication)
avatar_urlURL de la photo de profil
html_urlURL publique du profil
typeUser ou Organization
nameNom complet affiché sur le profil
companyEntreprise renseignée par l'utilisateur
blogSite web ou blog personnel
locationLocalisation déclarée
emailEmail public (souvent null sauf si rendu public volontairement)
hireableL'utilisateur se déclare-t-il disponible à l'emploi ?
bioBiographie du profil
twitter_usernameNom d'utilisateur Twitter/X lié
public_reposNombre total de dépôts publics
public_gistsNombre de gists publics
followers / followingRéseau social GitHub
created_atDate de création du compte
updated_atDate de dernière mise à jour du profil

Champs des dépôts

ChampDescription
name / full_nameNom court et nom complet (login/repo)
descriptionDescription du dépôt
forktrue si c'est un fork d'un autre dépôt
html_urlURL publique du dépôt
homepageSite web associé au projet
languageLangage principal détecté par GitHub
stargazers_countNombre d'étoiles
forks_countNombre de forks
open_issues_countNombre d'issues ouvertes
topicsTags associés au dépôt
licenseLicence du projet
archivedDépôt archivé (read-only)
created_at / pushed_atDate de création et de dernier push
visibilitypublic ou private (toujours public ici)
default_branchBranche par défaut (main ou master)

Cas d'usage

  • Audit de présence GitHub pour une organisation ou une liste de développeurs.
  • Veille concurrentielle sur des projets open source.
  • Constitution d'une base de données de profils développeurs pour le sourcing.
  • Alimentation d'un pipeline de traitement (n8n, Make, scripts Python) pour enrichissement ultérieur.

Limites

  • Données publiques uniquement. L'API GitHub ne donne pas accès aux informations privées sans autorisation OAuth dédiée.
  • L'email est fréquemment null : la plupart des utilisateurs ne le rendent pas public sur leur profil.
  • Soumis aux limites de taux de l'API GitHub : 60 requêtes/heure sans token, 5000 avec un token personnel.
  • Le champ starredRepositories peut contenir un grand nombre d'items et consommer beaucoup de quota : il est désactivé par défaut.

You might also like

Litinerant Scraper

saswave/litinerant-scraper

Litinerant.fr scraper. Permet d'extraire les annonces legal d'entreprise sur plusieurs critère comme la ville, le type d'annonce et la date. Identifier facilement les créations d'entreprise ou les fermetures par exemple

SeLoger Scraper ❤️ $1.5/1K (by ads URLs) ⚡

azzouzana/seloger-mass-products-scraper-by-items-urls

🔥 🔥Très simple! Entrez les URL des biens pour en obtenir les titres, descriptions, photos, évaluations énergétiques, prix, contacts, transports et plus encore ⚡ Extraire les biens depuis seloger.com rapidement avec les infos détaillées à faible coût, avec exportation en JSON, CSV, EXCEL, etc.

96

5.0

Annonce Legal Figaro Scraper

saswave/annonce-legal-figaro-scraper

Figaro scraper. Permet d'extraire les annonces legal d'entreprise sur plusieurs critère comme la ville, le type d'annonce et la date. Identifier facilement les créations d'entreprise ou les fermetures par exemple

Georisque Gouv FR Scraper

saswave/georisque-gouv-fr-scraper

Outil d'extraction de données spécialisé pour le portail français Géorisques (Ministère de la Transition Écologique). Rapport complet sur les risques naturels et technologiques pour une adresse ou parcelle cadastrale. Pour les professionnels de l'immobilier, assureurs, cabinets d'étude, urbanistes.

Github Profile Scraper

saswave/github-profile-scraper

GitHub User Profile Scraper. Extracts data from GitHub profiles, including followers, following, LinkedIn, Twitter, achievements and much more. Ideal for developers, researchers, and marketers. From a list of Github profile or a repository stargazers link