Caro colega.
Ainda vejo essa preocupação como algo bem de nicho mesmo. Mas se exerce alguma influência sobre os motores? Eu diria que sim.
as práticas de coleta de dados e rastreamento foram essenciais para seu desenvolvimento inicial?
Será mesmo que foram? Nesse ponto eu tendo a discordar. A Google mesmo, inicialmente tinha uma política de redirecionar o usuário o mais rápido possível para algo que estava buscando, e isso foi uma das características que popularizou o motor nos anos 90/2000.
O artigo a seguir resgata esse ponto:
The Internet Isn’t Meant To Be So Small
Em 2004, Larry Page foi perguntado sobre usar um modelo de negócio similar ao do YAHOO ou AOL, com um portal que mantem o usuário conectado ao serviço por mais tempo, e ele respondeu (em tradução livre):
Criamos nosso negócio em um sentido oposto. Queremos que você venha ao Google e rapidamente encontre o que procura. Então ficaremos felizes em redirecioná-lo a outros sites. E aliás, esse é o ponto. A estratégia de portal tenta controlar toda a informação.
Ou seja, o que foi realmente decisivo para o serviço se popularizar foi um pensamento contrário ao que eles tem hoje. E que aliás, só tem feito o serviço ficar cada vez pior.
O artigo a seguir não é muito confortável de ler, mas é super informativo também sobre um problema que está afligindo motores de busca hoje em dia, que é o jogo que toda uma indústria tenta fazer para aparecer nas pesquisas, e mais recentemente os lixos gerados por inteligência artificial que se infiltram nos resultados.
How bad are search results? Let's compare Google, Bing, Marginalia, Kagi, Mwmbl, and ChatGPT
É claro que construir um motor de busca não é trivial, nem tanto pela tecnologia envolvida, mas principalmente pela escala disso que demanda um motor de processamento bastante robusto, e consome bastante banda de rede, na busca por conteúdo indexável.
Algumas estratégias podem amenizar isso, mas no geral não é algo barato de se fazer. E quando entramos no quesito financiamento é que surgem os problemas, pois alguns provedores escolheram justamente sacrificar a privacidade para, com os dados que obtem, custear a implementação e manutenção das rotinas de indexação.