Instalando o R e o RSTUDIO
Começando: O que é o R e o RStudio?
Bem-vindo ao seu GUIA DO MOCHILEIRO DO UNIVERSO R
Provavelmente essa é sua primeira exposição em programação e talvez esteja um pouco ansioso. Fique tranquilo, isso é compreensivo, e não há razões para você se preocupar.
Há mais de 2 décadas, milhares de pessoas inteligentes por todo mundo contribuem de várias formas para fazer o trabalho com R mais fácil e mais amigável para os usuários.
A linguagem R, como qualquer língua, precisa ser aprendida, como? PRATICANDO, PRATICANDO, PRATICANDO. Frustação é inevitável, ela é parte mais importante do PROCESSO. Entenda, aprender R é um PROCESSO!!
Saiba que o R é uma linguagem que não é usada somente na academia para atividades científicas. Essa linguagem pode ser utilizada nas empresas, ajudando você a gerar relatórios e tomar decisões.
O R é uma linguagem funcional/orientada a objetos criada em 1996 por Ross Ihaka e Robert Gentleman que aliada a um ambiente integrado permite a manipulação de dados, realização de cálculos e geração de gráficos.
Uma curiosidade é que o nome R é a letra inicial do primeiro nome de cada um dos seus criadores. Mas não foi apenas por isso que a linguagem recebeu esse nome …R é semelhante à linguagem S desenvolvida pela AT&T’s Bell Laboratories e que já era utilizada para análise de dados, mas com a vantagem de ser de livre distribuição (opensource).
R é uma linguagem de programação com foco em análise de dados. Ou seja, voltada à interação dinâmica com os dados e modelos. Além disso, R é gratuito e de código aberto e seu ambiente permite explorar dados interativamente.
Assim, o R é uma linguagem de programação, além de um ambiente para computação estatística e gráfica. Possui uma ampla variedade estatística (modelagem linear e não-linear, testes estatíticos clássicos, análise série temporal, classificação, agrupamento, aprendizado de máquinas,…) e técnicas para gerar gráficos por meio de seus pacotes.
Por isso o R é muito utilizado para realizar análises e gráficos de qualidade e seu uso é amplamente aceito por revistas científicas.
Porém o GUI do R não muito amigável para o usuário, veja abaixo:
Pensando em resolver esse problema, Empresas desenvolveram softwares que trazem uma interface amigável, o mais conhecido é o RStudio.
Aqui nós assumiremos que você usará o R por meio do programa RStudio.
Um jeito simples de entender como isso funciona é pensar que o R é o motor de um carro (que faz o carro ser funcional) e o RStudio é o painel do carro (que auxilia o motorista a guiar o carro).
Figura de analogia entre o R e o RStudio.
Sendo bem mais preciso, o R é uma linguagem de programação que realiza análises, enquanto o RStudio é um ambiente integrado de desenvolvimento (IDE,integrated development environment) que oferece uma interface com ferramentas e características únicas.
Vamos colocar a mão na massa?
Instalação do R
O R está diponível para os sistemas operacionais Linux, Mac e Windows. Aqui vão os passos necessários para instalação em cada um deles da versão mais recente do R (4.1.1- 10/08/2021). Caso enfrente problemas em alguma das etapas, verifique também as instruções no site do CRAN.
Se mesmo assim tiver problemas ou tenha dúvidas não hesite: Entre em contato francisco.novais@usp.br.
Instalação do R no Windows
Faça o download do executável do R versão 4.1.1 contido neste link. Clique em Download R 4.1.1 for Windows. Ou seu computador salvará automaticamente na pasta ‘Downloads’ ou abrirá uma caixa, e você salvará na pasta que desejar. Instale o programa com extensão .exe
.
Após terminar, clicando no icone do R você verá uma janela semelhante a figura abaixo.
Instalação do R no MAC
Faça o download do executável do R versão 4.1.1 contido neste link. Esta versão é compatível com as distribuições Mac OS X 10.6 ou superiores. Clique em R-4.1.1.pkg (notarized and signed). Ou seu computador salvará automaticamente na pasta ‘Downloads’ ou abrirá uma caixa, e você salvará na pasta que desejar. Instale o programa com extensão .pkg
clicando duas vezes e seguindo as instruções do instalador.
Após terminar, clicando no icone do R você verá uma janela semelhante a figura acima.
Instalação do R no Ubuntu
Aqui consideraremos as distribuições Ubuntu LTS (Long Term Support), mas no site do CRAN você encontrará instruções também para debian, redhat e suse.
O primeiro passo para a instalação é procurar pelo arquivo sources.list
e adicionar a ele o caminho para o “espelho” do R de sua preferência (veja as opções aqui) e a distribuição Linux referente ao seu sistema. Normalmente, o arquivo esta localizado em:
cd /etc/apt/
Pode ser que o arquivo esteja com permissão apenas para leitura para os usuários comuns, portanto acesse-o como super usuário utilizando um editor de texto de sua preferência e adicione o caminho. Exemplo:
sudo nano sources.list
Aqui consideraremos a distribuição Ubuntu bionic (18.04) e escolheremos o espelho mais próximo da sua localização utilizando o direcionamento https://cloud.r-project.org, portanto adicionamos a linha:
#deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran35/
Se esta com dúvida qual é a distribuição que esta esta usando, utilize o comando para descobrir:
lsb_release -a
A partir disso basta seguir os comandos:
sudo update
sudo apt-get install r-base
sudo apt-get install r-base-dev
Você pode abrir o R pela linha de comando ou clicando no icone.
Instalação do RStudio
O RStudio é uma interface mais amigável para se trabalhar com R, com funcionalidades muito práticas.
ENTENDA: Você não utilizará o R que está instalado, você usará ele por meio do RStudio.
A interface do RStudio também esta disponível para os sistemas Windows, Mac e Linux. Para qualquer um deles, selecione o arquivo correspondente no site.
- No caso de um sistema linux, o arquivo baixado terá extenção
.deb
(para Ubuntu) ou.rpm
(para Fedora) e basta clicar duas vezes no arquivo que o gerenciador de pacotes do Linux iniciará a instalação.
Após a instalação você abrirá o RStudio, que reconhece automaticamente o R que está instalado.
Interface do RStudio
Note que abre inicialmente 3 painéis: o painel ‘console’, o painel de arquivos e o painel de ambiente.
Conceitos básicos de programação e terminologias.
R é uma linguagem computacional que permite que usuário programe algoritmos e utilize ferramentas que foram programadas por outras pessoas.
Calma professor!! Já tem um monte de informações nas linhas acima que eu não entendi!
Ok! Vamos devagar!
Nós falamos utilizando a linguagem natural e com isso conseguimos passar informações adiante e fazer com que outras pessoas executem tarefas. As máquinas também fazem isso!!!
As unidades de processamento (CPUs) são projetadas para reconhecer instruções codificadas como padrões de bits. Essa coleção de instruções, juntamente com o sistema de codificação, é chamada de linguagem de máquina que é um sistema binário. Agora, pense como seria difícil se todo programa que fosse escrito tivesse que fazer uso de linguagem de máquina.
Assim, as linguagens de programação têm sido desenvolvidas buscando permitir que algoritmos sejam expressos em um formato palatável aos humanos e facilmente convertidos em instruções de linguagem de máquina. Ou seja, uma linguagem de programação é uma forma se comunicar com o computador.
O R é uma linguagem de programação interpretada e uma ferramenta poderosa para manipulação, processamento, visualização e análise de dados, bem como simulações e modelagem estatísticas. Mas o que seria uma linguagem interpretada? Relaxa … eu explico.
A linguagem interpretada é uma linguagem de programação, onde o código fonte é executado por um programa de computador chamado interpretador. O interpretador lê um programa escrito em linguagem de alto nível e o executa, ou seja, faz o que o programa diz. Ele processa o programa um pouco de cada vez, alternadamente: ora lendo algumas linhas, ora realizando computações.
Galera, vamos começar falando sobre Lógica de Programação! Em primeiro lugar, por que nós chamamos de lógica? Porque nós vamos utilizar princípios lógicos para resolver os problemas. Como assim? É necessário utilizar uma sequuência de raciocínios coerentes para alcançar um determinado objetivo.
Nós podemos descrever esses raciocínios como uma sequência de instruções ou passos. Professor, e o que seria uma instrução? É um conjunto de regras ou normas simples e bem definidas para a realização ou emprego de algo, indicando ao computador uma ação ou função elementar a ser executada.
ENTENDA: computador não pensa, ele é burro – ele somente recebe ordens e as executa! O programador de computador – sim – é o cara inteligente que dá as ordens (NO CASO VOCÊ =D).
Então, vejam só a linha de raciocínio… Um computador é excelente para realizar cálculos e processamentos, mas ele não consegue pensar sozinho. Já o programador é ótimo em pensar sozinho sobre como resolver problemas, mas ele não tem capacidade de fazer bilhões de cálculos e processamentos. Logo, eles se juntam de forma que o programador possa pensar na forma de resolver um problema e criar um conjunto de instruções para que o computador apenas as execute.
Sabe qual é o nome dado a um conjunto de instruções? ALGORITMO!
Programadores são especialistas em construir algoritmos. Formalmente podemos definir um algoritmo como um conjunto predeterminado e bem definido de passos destinados à solução de um problema, com um número finito de etapas. Professor, você pode dar um exemplo? Claro! O exemplo mais comum da bibliografia é mostrado a seguir: uma receita de bolo (de caneca, para fazer em seu laboratório!!!).
Qual é o problema que desejamos resolver? Nós queremos fazer um bolo! Observem que para solucionar nosso problema – fazer um bolo –, é necessário seguir uma sequência de passos finitos e predeterminados.
FAZER UM BOLO É UM ALGORÍTMO!!!
No fim das contas um software é apenas a representação de um algoritmo. Claro que é um algoritmo bastante complexo que exige um conjunto de recursos e ferramentas computacionais, mas – no fim das contas – é apenas um algoritmo.
Agora vamos a alguns conceitos:
Console: O painel ’console é o RGUI, ou seja, é o próprio programa R. Você pode executar comandos diretamente nele ou não (veremos com calma).
Código de corrida (Run): quando você aperta
Enter
em um comando dentro do console, você o executa.Painel Área de trabalho (Enviroment): Painel importante em que você pode ver e abrir seus objetos criados.
Objetos: São valores, vetores, matrizes, tabelas, listas e arrays salvos no seu R. Veremos isso com calma.
Funções: também são chamadas de comandos. Os comandos são a alma do R. Você insere as entradas (chamadas de argumentos) e o R retornará as saídas (o resultado da função).
Utilizando o RStudio
Vamos voltar ao RStudio
Interface do RStudio
Você pode abrir o RStudio em seu computador e iniciar um novo Script em “File” -> “New File” -> “New RScript”. Você também pode fazer isso com CTRL + SHIFT + N
ou acessando o atalho.
Vamos dividir a tela do RStudio em quatro grandes áreas:
- Script: A tela superior esquerda do RStudio é o editor de texto onde você vai escrever seus Scripts. Ele possui code highlighting entre outras funcionalidades.
- Console: No canto inferior esquerdo fica o console.
- Área de trabalho e histórico: Ficam no canto superior direito. Os objetos criados e o histórico dos comandos podem ser acessados ali.
- Arquivos, Gráficos, Pacotes, Ajuda: Ficam no canto inferior direito. Você pode explorar pastas e arquivos diretamente do RStudio na aba “Files”; os gráficos que forem feitos apareceram na aba “Plots”. Os pacotes instalados em sua máquina estão listados em “Packages”. As ajudas das funções aparecem em “Help”. E o “Viewer” serve para visualização de páginas em HTML e JavaScript.
Agora você irá personalizar o RStudio para deixá-lo com a sua cara.
Tópicos abordados pessoalmente:
- Personalizando o RStudio;
- Criando Projetos
- Executando o primeiro comando;