Contribuições do livro - Aprendizado de Máquina Reprodutível para Detecção de Fraude em Cartão de Crédito

Contribuições originais do livro em relação à literatura atual:

Simulador de dados de transação sintéticos: Este livro propõe um simulador de dados de transação que permite a criação de conjuntos de dados de transação sintéticos de complexidade variável. Em particular, o simulador permite variar o grau de desequilíbrio de classes (baixa proporção de transações fraudulentas), contém variáveis numéricas e categóricas (com características categóricas que possuem um número muito alto de valores possíveis) e apresenta cenários de fraude dependentes do tempo. O simulador é apresentado no Capítulo 3, Seção 2.
Reprodutibilidade: Este livro é um Jupyter Book, que permite executar ou modificar interativamente as seções deste livro que contêm código. Juntamente com o gerador de dados sintéticos, todos os experimentos e resultados apresentados neste livro são reproduzíveis. Uma descrição de como executar este livro na nuvem ou em seu computador é fornecida no Capítulo 2, Seção 3.
Revisão do estado da arte: O livro sintetiza as pesquisas recentes sobre o tema de aprendizado de máquina para detecção de fraudes em cartões de crédito (ML para CCFD). Ele destaca os princípios básicos apresentados nessas pesquisas e resume os principais desafios dos sistemas de detecção de fraudes. A revisão é apresentada no Capítulo 3, seção 3.
Metodologia de avaliação: Uma grande contribuição deste livro é uma apresentação e discussão detalhadas das métricas de desempenho e metodologias de validação que podem ser usadas para avaliar a eficiência dos sistemas de detecção de fraudes. As métricas de desempenho são abordadas no Capítulo 4. As metodologias de validação e estratégias para seleção de modelos são abordadas no Capítulo 5.
Aprendizagem desbalanceada: O livro fornece uma extensa avaliação experimental de abordagens de aprendizagem desbalanceada, abrangendo técnicas sensíveis ao custo, reamostragem e de conjunto. Para cada abordagem, a avaliação experimental inclui um exemplo de brinquedo, um conjunto de dados de transações simuladas e um conjunto de dados do mundo real. O tópico é abordado no Capítulo 6. A principal conclusão da avaliação experimental proposta é que os benefícios das técnicas de aprendizagem desbalanceada são mitigados e dependem intimamente das métricas de desempenho almejadas.
Aprendizagem profunda: O recente advento das técnicas de aprendizagem profunda levou a comunidade de pesquisa a se interessar cada vez mais por suas aplicações na detecção de fraudes. Este livro é o primeiro a entrar em detalhes sobre o uso e a implementação desses tipos de métodos para o problema de detecção de fraudes em cartões de crédito. O Capítulo 7 cobre a implementação e avaliação de técnicas como redes neurais feed-forward totalmente conectadas e técnicas mais avançadas, como aprendizado de representação com autoencoders ou modelos sequenciais, como redes convolucionais ou de memória de longo prazo.