en_core_web_lg para extrair entidades de
linguagem natural (PER, ORG, LOC, MISC) além do regex customizado.função, classe, first, one, two, max, min, sdk, etc.NERPipeline alterado de pt_core_news_lg para en_core_web_lg.graph_builder.py agora roda com spaCy habilitado por padrão.| Granularidade | Nós (02) | Nós (03) | Arestas (02) | Arestas (03) |
|---|---|---|---|---|
| Sentença | 921 | 5.791 | 1.064 | 5.947 |
| Parágrafo | 1.763 | 7.746 | 4.931 | 22.552 |
| K-chars (500) | 1.756 | 7.845 | 4.163 | 15.160 |
O spaCy aumentou os grafos em ~4x (nós) e ~4-5x (arestas), adicionando entidades de linguagem natural que o regex não capturava.
| Métrica | 02-filtered | 03-spacy |
|---|---|---|
| Nós | 1.763 | 7.746 |
| Arestas | 4.931 | 22.552 |
| Densidade | 0,0032 | 0,0008 |
| Grau médio | 5,59 | 5,82 |
| Grau máximo | 156 | 677 |
| Componentes conectados | 166 | 1.323 |
| Maior componente (%) | 74,9% | 59,8% |
| Diâmetro | 12 | 11 |
| Caminho médio | 4,16 | 3,88 |
| Clustering médio | 0,4864 | 0,4029 |
| Transitividade | 0,3910 | 0,2718 |
| Entidade | Tipo | Grau |
|---|---|---|
| claude | LIB | 677 |
| api | TECH | 585 |
| git | TECH | 465 |
| mcp | TECH | 374 |
| anthropic | LIB | 316 |
| oauth | TECH | 306 |
| windows | TECH | 283 |
| cli | ORG | 261 |
| github | TECH | 254 |
| growthbook | LIB | 223 |


claude consolidou-se como hub principal (grau 677, 4x mais que antes).cli aparece como nova entidade relevante (ORG, grau 261) — detectada
pelo spaCy em comentários referenciando “CLI”.growthbook ganhou destaque (grau 223) — ferramenta de feature flags
usada no Claude Code.oauth e windows subiram no ranking, refletindo os subsistemas
de autenticação e compatibilidade cross-platform.
cli classificado como ORG pelo spaCy — deveria ser TECH ou MISC.função, first, one,
max, sdk).