Orange

De LARHUD
Revisão de 09h30min de 2 de julho de 2018 por Rodrigo DG (Discussão | contribs)

Ir para: navegação, pesquisa

[Orange] é um programa que possibilita a mineração de dados de uma forma frutífera e divertida através de seu [software] de código aberto, <https://github.com/biolab/orange3>, que trabalha com aprendizado de máquina (machine learning) e visualização de dados (data visualization). Pode ser utilizado tanto por usuários iniciantes quanto especialistas. Seus fluxos de trabalho são baseados em análise de dados interativos atrelados a uma grande opção de ferramentas, incluindo uma variedade de técnicas de visualização, exploração, pré-processamento e modelagem de dados. Pode ser usado através de uma interface de usuário agradável e intuitiva ou, para usuários mais avançados, como um módulo para a linguagem de programação Python. Considerando que através da mineração de dados busca-se, entre outras relações, identificar padrões de similiridade ou de não conformidade nos conjuntos de dados, o Orange oferece diversos recursos de base estatística para o processamento dos dados.

Origem

O software é desenvolvido pelo [Laboratório de Bioinformática] dentro da Faculdade de Informação e Computação na Universidade de Ljubljana localizada na Eslovênia, e por ser de código aberto conta com a colaboração desta comunidade. Em 2018, a ferramenta completa seu vigésimo primeiro ano de história e este longo tempo é motivo de destaque, pois atesta a maturidade, segundo seus criadores, desta iniciativa dentro de um ambiente efêmero como o de desenvolvimento e lançamento de softwares.

Licença

Sobre o software é permitido sua redistribuição e/ou modificação sob os termos da [Licença Pública Geral GNU], publicada pela [Free Software Foundation]. A documentação, conteúdo do site, assim como outros conteúdos não relacionados aos códigos do software estão licenciados sob a forma de [Creative Commons Attribution-ShareAlike].

Instalação

Na [página] são disponibilizadas diferentes opções de instalação há versões para [Windows], [Linux] e [Mac]. É possível baixar um instalador com a última versão, neste caso, o Orange e o Miniconda serão instalados no seu computador, outra opção é realizar o download do Orange e Python ou ainda pode-se dentro do Python instalar o pacote Orange.

Características

O programa trabalha com arquivos nos formatos:

. Excel, arquivos delimitados por vírgulas e tabulações (.xlsx, .csv, .tab);

. Dados on-line no format do Google Planilhas;

. Imagens (.jpg, .tiff, .png) através do complemento ImageAnalytics;

. Arquivos de texto (.txt, .docx, .odt) com o complemento, Orange3-Corpus; e

. Banco de dados PostgreSQL e MSSQL, por meio do complemento SQL.

Com estes arquivos é possível criar um fluxo de trabalho de análise de dados. A instalação padrão inclui vários algoritmos de aprendizado de máquina, pré-processamento e visualização de dados em seis conjuntos de complementos (dados, visualização, classificação, regressão, avaliação e não supervisionados). Assim é possível ler os dados, mostrar uma tabela de dados, selecionar recursos, comparar algoritmos de aprendizado, visualizar elementos de dados, etc. Um exemplo do fluxo de trabalho no Orange.

Fluxo de Trabalho Orange

Documentação

O site fornece uma excelente documentação sobre a ferramenta, disponibilizando tutoriais https://www.youtube.com/channel/UClKKWBe2SCAEyv7ZNGhIe4g[em vídeo]], um guia para os primeiros passos, instruções para a utilização dos próprios dados e uma página explicando como utilizar cada um dos complementos disponibilizados por padrão na ferramenta. A página sobre a [documentação] se divide em três partes a primeira, com as informações já descritas, uma segunda com dados sobre desenvolvimento e a última com instruções sobre a biblioteca de mineração de dados.