ner-cooccurrence-graphs

Relatório de Extração e Análise — claude-code (restored-src)

Repositório analisado

Estatísticas da extração

Métrica Valor
Arquivos TypeScript 1.888
Arquivos de documentação 0
Total de blocos de texto 78.526
Total de caracteres 18.348.792

Distribuição por tipo de bloco

Tipo Quantidade Descrição
import 16.035 Imports de módulos e pacotes
comment 43.880 Comentários de linha (//)
code 10.550 Classes, interfaces, funções, enums
docstring 8.061 Blocos JSDoc / /* */

Métricas dos grafos de co-ocorrência

NER executado com regex + dicionários (sem spaCy), com filtragem de ruído (stopwords para path fragments, protocolos genéricos e palavras ambíguas).

Métricas gerais

Métrica Sentença Parágrafo K-chars (500)
Nós 921 1.763 1.756
Arestas 1.064 4.931 4.163
Densidade 0,0025 0,0032 0,0027
Grau médio 2,31 5,59 4,74
Grau máximo 54 156 128
Componentes conectados 183 166 175
Maior componente (%) 48,3% 74,9% 73,0%
Diâmetro 17 12 13
Caminho médio 4,63 4,16 4,39
Clustering médio 0,2271 0,4864 0,4529
Transitividade 0,2010 0,3910 0,3346

Top 10 entidades por grau (parágrafo)

Entidade Tipo Grau
claude LIB 156
api TECH 146
mcp TECH 131
git TECH 112
anthropic LIB 110
github TECH 66
oauth TECH 65
ink LIB 63
react LIB 60
windows TECH 57

Figuras geradas

Arquivo Conteúdo
figures/degree_dist_sentence.png Distribuição de grau — sentença
figures/degree_dist_paragraph.png Distribuição de grau — parágrafo
figures/degree_dist_k_chars.png Distribuição de grau — k-chars
figures/graph_viz_sentence.png Grafo — sentença (layout de força)
figures/graph_viz_paragraph.png Grafo — parágrafo
figures/graph_viz_k_chars.png Grafo — k-chars
figures/comparison_table.png Tabela comparativa de métricas
figures/centrality_comparison.png Top entidades por centralidade

Análise e insights

1. Estrutura geral

Em relação à iteração 01, a estrutura do repositório analisado permanece a mesma. A mudança desta etapa está na qualidade semântica do grafo: a filtragem remove nós artificiais e torna as relações entre entidades mais interpretáveis.

Tabela comparativa de métricas

2. Comparação entre granularidades

Distribuição de grau por parágrafo

3. Entidades centrais

Top entidades por centralidade

4. Propriedades de rede

Grafo de co-ocorrência por parágrafo

5. Filtragem de ruído aplicada

Foram removidos das entidades:

6. Próximos passos