Skip to content

BOU-Guard (Behavior Observation Unit - Guard) baseado na tecnologia GPT3.5-Turbo, para detectar e filtrar conteúdos preconceituosos e ofensivos. Nesta nova versão foi incluso a biblioteca NLTK (Natural Language Toolkit) para o pré-processamento e analise de sentimentos, utilizando o dicionário LIWC-PT/BR (Linguistic Inquiry and Word Count).

Notifications You must be signed in to change notification settings

guilhermebou/BOU-Guard-0.2

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

VII Mostra de Software - TechWeek 2023

Repositório com o código fonte submetido para VII Mostra de Software - UFU | TechWeek 2023.

📌 Overview

Nesta pasta, encontra-se o código-fonte necessário para rodar a aplicação e saídas geradas.

👀 Observações:

📍 Arquivo código-fonte é “BOU-Guard-0.2.py”, esse que deve ser executado para a avaliação.

📍 Os arquivos restantes “liwc_pt.json” Dicionário utilizado - Pasta “Outputs” Está alocando as saídas geradas pela aplicação.

🏷️ Nota

Nesta implementacao utilizamos o python em sua versao 3.10.4, a biblioteca python BeautifulSoup em sua versão 4.12.2 ela é utilizada para realizar a raspagem de dados (web scraping), biblioteca python NLTK na versão 3.8.1 para o processo do pré-processamento com a tokenização, utilizado o dicionario LIWC Portugues, também utilizado a Interface de Programação de Aplicação (API) GPT-3.5-Turbo para realizar a analise, identificação e listagem das expressões desejadas, por ultimo, utilizado a biblioteca Requests 2.31.0 para realizar a requisiçao nos sites obtendo o "Hypertext Transfer Protocol" (HTTP). O desenvolvimento foi realizado em uma máquina com sistema operacional de 64 bit- Windows 10 Home.

📝 Requisitos/Instalação ⚙️

▶️ Python 3.10.4: Download no site oficial do Python (https://www.python.org).

▶️ Biblioteca Beautiful Soup 4.12.2: Para a instalação da biblioteca é necessário utilizar o gerenciador de pacotes 'pip'. Abra o terminal ou prompt de comando e execute o seguinte comando:

pip install beautifulsoup4==4.12.2

▶️ Biblioteca NLTK 3.8.1: Para a instalação da biblioteca é necessário utilizar o gerenciador de pacotes 'pip'. Abra o terminal ou prompt de comando e execute o seguinte comando:

pip install nltk==3.8.1

Em seguida, execute um teste de aplicação para instalar o módulo utilizado.

import nltk
nltk.download('punkt')
from nltk.tokenize import word_tokenize

▶️ API GPT-3.5 Turbo: Para a API, é preciso obter as credenciais de API da OpenAI, realizando cadastro e emissão da chave de acesso "API-KEY" (https://www.openai.com).

▶️ Biblioteca Requests 2.31.0: Para a instalação da biblioteca é necessário utilizar o gerenciador de pacotes 'pip'. Abra o terminal ou prompt de comando e execute o seguinte comando:

pip install requests==2.31.0

✔️ Já instalei! Como Testar?!

Como ainda estamos nos referindo a uma aplicação em andamento, algumas variáveis, como por exemplo, "link" e "prompt", estão estáticas. Portanto, para rodar a aplicação corretamente, segue o passo a passo para realizar as devidas alterações no código-fonte.

1️⃣ Adicionar sua respectiva API-KEY.

# API-KEY
token = 'XXXXXXXXXXXXXXXXXXXXXXX'

2️⃣ Referencie de forma individual os links dos sites para que sejam avaliados.

# URL DO SITE
link = "https://www.SiteParaAvaliacao.com"

3️⃣ Referencie de forma individual o prompt com base na contextualização que deseja ser avaliada no site submetido na variável "link".

prompt = [
        #{'role': 'user', 'content': 'identifique e enumere as expressões associadas ao racismo'},
        {'role': 'user', 'content': format}
    ]

4️⃣ Agora só executar a aplicação! 🏁

🌐 Sites Avaliados

👀 Observação: HyperLinks referenciados leva direto para as páginas que foram avaliadas.

Machismo Racismo Homofobia
Pure Break Direito Humanos ES Revista Marie Claire
Espaço Viveka Governo de Tocantins Governo de Tocantins
Lab. de Educação VAGAS Hypeness
Revista Marie Claire Revista Marie Claire Gazeta
Catho JusBrasil Uol
Uol APPSindicato Amo Direito
CIEE Estado De Minas Catraca Livre
Leia Já Leiturinha CIEE
Alto Astral BBC Exame
Ne10 - Uol Geledes Ibahia

About

BOU-Guard (Behavior Observation Unit - Guard) baseado na tecnologia GPT3.5-Turbo, para detectar e filtrar conteúdos preconceituosos e ofensivos. Nesta nova versão foi incluso a biblioteca NLTK (Natural Language Toolkit) para o pré-processamento e analise de sentimentos, utilizando o dicionário LIWC-PT/BR (Linguistic Inquiry and Word Count).

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages