Entrevista #8 – Sofia Marshallowitz

Você já ouviu falar em Ciência de Dados (ou Data Science)? 

 

Esta área tem ganhado cada vez mais espaço no mercado, principalmente com o advento do Big Data.  No campo do Direito não é diferente, a ciência de dados está trazendo e ainda trará inúmeros benefícios.

 

Portanto, a capacitação dos profissionais do direito para qualificar sua participação em projetos de ciência de dados não é apenas essencial, mas um grande diferencial em sua carreira. Mesmo que seja apenas para conhecer as ferramentas e seu uso potencial e liderar sua equipe para essa mudança de cultura, ou para se tornar um usuário avançado dessas soluções.

 

Sendo assim, convidamos a Sofia Marshallowitz, cientista de dados, para explicar algumas características e como a ciência de dados pode ser aplicada ao Direito.

 

Confira a entrevista abaixo:

 

1 – O que é a Ciência de Dados (Data Science)? Como ela pode ser aplicada ao Direito?

 

Sofia Marshallowitz — Ciência de Dados é, em linhas gerais, uma área na qual você lida com dados a partir de conhecimento de negócio e procedimentos estatísticos, computacionais (e.g. machine learning) e matemáticos para estudar riscos, oportunidades e possibilidades aos quais um determinado evento de interesse está exposto. Na prática, prefiro dizer que Ciência de Dados é otimização de processos, é o desenvolvimento de conhecimento.

 

É uma área muito ampla e a verdade é que não existe um perfil “único” de cientista de dados. Pelo contrário: a gente é um canivete-suíço! É claro que há uma base de habilidades fundamentais para você trabalhar com data science, como saber desenvolver uma linguagem de programação mais difusa na área (e.g. Python, R), ter conhecimentos em matemática e em algoritmos de aprendizado de máquina e saber lidar ao menos com banco de dados relacionais (SQL), mas cada projeto ou empresa tem sua própria necessidade: já vi locais que preferiam de cientistas de dados que fossem mais habilidosos com visualização de dados, outros que experiência com visão computacional era requisito ou que saber a parte de business era mais importante.

 

A Ciência de Dados no Direito é fascinante e sua aplicação é vasta. Existe muita coisa a ser explorada. Podemos descobrir, por exemplo, o entendimento sobre um tema por tribunal ou por magistrados, calcular com mais precisão a chance de êxito e o tempo de trâmite, verificar qual tese é mais aderente, quais são as doutrinas e origem das jurisprudências mais citadas por uma turma ou julgador. Além disso, também podemos aplicar essas técnicas dentro de um escritório para ir além de simplesmente saber qual é o tempo gasto por atividade e descobrir o que faz com que gastemos tanto tempo para uma coisa e sejamos rápidos para outras. Também, a ciência de dados viabiliza outros produtos interessantes, como informações para conteúdo (infográficos, textos, vídeos) mais cativantes e chatbots.

2 – O LinkedIn divulgou, no começo do ano, uma lista com as profissões em alta para 2020 e cientista de dados estava nessa lista. Pelo que você tem visto, entre os escritórios de advocacia e departamentos jurídicos, há uma demanda muito grande por estes profissionais?

 

Sofia Marshallowitz — Dentro do universo jurídico, há uma diferença de procura por parte de escritórios, departamentos jurídicos e lawtechs. Em geral, as lawtechs contratam mais os cientistas de dados, inclusive porque poucos escritórios e departamentos contam com um setor de dados ou tecnologia para o Direito e acabam contratando uma empresa para isso. Porém, a quantidade de vagas para cientista de dados dentro do nosso universo ainda é bem menor em comparação com as demais áreas e para quem tem interesse em uma oportunidade, recomendo manter-se dentro de grupos sobre legaltechs e vagas jurídicas porque, às vezes, algumas colocações não são anunciadas abertamente, como no LinkedIn ou é algo mais informal, do tipo “fiquei sabendo que determinado lugar quer contratar, por que você não vai falar com eles?”.

3 – Como é o dia a dia de um cientista de dados jurídicos? (obs: me corrija se eu estiver errado com relação ao “cientista de dados jurídicos”)

 

Sofia Marshallowitz — Apesar de não usarem essa nomenclatura (cientista de dados jurídicos), confesso que sou super favorável em adotá-la, haha. Não há o costume de pontuar o escopo dos dados de um cientista dados, como, por exemplo, cientista de dados bancários ou cientista de dados imobiliários.

 

O dia-a-dia de um cientista de dados, seja ele jurídico ou não, varia muito conforme o projeto. Mas, buscando os padrões do cotidiano, algo chave no cientista de dados jurídicos é acompanhar as mudanças do Direito, tal qual o advogado. É preciso ler os assuntos atuais, monitorar o que está sendo comentado sobre o tema principal do projeto, conversar com os operadores do Direito. Aliás, diálogo é importantíssimo e manter contato com os advogados para entender suas problemáticas e dúvidas também faz parte do dia-a-dia, assim como redigir e apresentar os resultados de maneira compreensível a um leigo.

 

Além disso, o dia-a-dia envolve também coletar, limpar e organizar dados, pensar em soluções e modelos cabíveis e desenvolvê-los, treiná-los e testar hipóteses (e é por isso que é importante estar em contato com operadores do Direito).

4 – O que eu preciso fazer para seguir essa carreira? Existe algumas habilidades específicas?

 

Sofia Marshallowitz — Um bom cientista de dados tem conhecimento da área na qual aplica seus modelos. E enxergo que no Direito isso é ainda mais necessário: é uma matéria viva, com novidades cotidianas e um sistema complexo e regrado. Se às vezes já é confuso para quem está dentro, imagina para quem não está? E muita das hipóteses testadas advém de experiências e impressões, e uma boa análise de dados também é baseada nisso.

 

Se você deseja ser um cientista de dados, é fundamental ser curioso, e aprender ao menos uma linguagem de programação utilizada na área, saber trabalhar com bancos de dados, com visualização de dados, ter conhecimento matemático (especialmente regressão, otimização e estatística bayesiana) e lidar com aprendizado de máquina (como algoritmos de árvores de decisão, SVM e KNN). E, claro: comunicação e conhecimento do negócio faz parte da caixa de ferramentas do cientista de dados.

 

E se você deseja trabalhar com ciência de dados jurídicos, compreender o funcionamento do sistema judiciário brasileiro, os ritos processuais, o cotidiano dos profissionais do Direito e as discussões do momento são pontos muito desejáveis!

 

5 – Falando sobre linguagem, teria alguma específica que você indicaria para quem deseja dar o primeiro passo?

 

Sofia Marshallowitz — Eu sou fangirl do R, que é uma linguagem com foco em estatística, desenvolvida justamente para análise, manipulação e visualização de dados. Há vários pacotes (que são, em resumo, códigos contendo funções “já prontas” para uso, poupando assim ter que escrever e errar essas funções) voltados para ciência de dados e machine learning. Além de uma comunidade fantástica. Python também é muito boa, tem sintaxe simples e otimiza o tempo de desenvolvimento. Ambas são excelentes ponto de partida. E aprenda SQL concomitantemente. SQL é a linguagem para interagir com bancos de dados relacionais.

 

(Mas, em tempo, se você tem algum conhecimento em orientação a objetos e Java, você pode dar o primeiro passo com Scala).

Sofia Marshallowitz – Cientista de Dados no Pires & Gonçalves Advogados, pesquisadora do Lawgorithm, estudante de Direito na Universidade Presbiteriana Mackenzie. Possivelmente um bot.