Análise de Dados e Estatística

CIÊNCIA DE DADOS PARA CONSTRUÇÃO, ARQUITETURA E ENGENHARIA

Este curso é uma Introdução à Ciência de Dados para Profissões do Ambiente Construído. Você aprenderá habilidades práticas voltadas para a construção de profissionais do setor, com ênfase na programação básica em Python, nas bibliotecas Pandas e Scikit-learn e nos cadernos Colaboratory Juptyer. A indústria da construção está explodindo com fontes de dados que afetam o desempenho energético do ambiente construído e a saúde e o bem-estar dos ocupantes. As planilhas não funcionam mais como a única ferramenta de análise para profissionais desse campo. A participação em cursos regulares de ciência de dados pode fornecer habilidades como programação e estatística; no entanto, o contexto aplicado aos edifícios está ausente, o que é a parte mais importante para iniciantes. Este curso se concentra no desenvolvimento de habilidades de ciência de dados para profissionais especificamente no setor de ambiente construído. Destina-se a arquitetos, engenheiros, gerentes de construção e instalações com pouca ou nenhuma experiência anterior em programação. É apresentada uma introdução às habilidades de ciência de dados no contexto das fases do ciclo de vida da construção. Os participantes usarão grandes conjuntos de dados abertos desde o projeto, construção e operações dos edifícios para aprender e praticar técnicas de ciência de dados. Essencialmente, este curso foi desenvolvido para adicionar novas ferramentas e habilidades para complementar as planilhas. Os principais tópicos técnicos incluem carregamento de dados, processamento, visualização e aprendizado de máquina básico usando a linguagem de programação Python, a análise de dados Pandas e o sci-kit de bibliotecas de aprendizado de máquina e o ambiente de colaboração baseado na web. Além disso, o curso fornecerá vários caminhos de aprendizado para várias tarefas relacionadas ao ambiente, para facilitar o crescimento.

UNIVERSIDADE NACIONAL DE CINGAPURA ANÁLISE DE DADOS E ESTATÍSTICA ARQUITETURA ENGENHARIA ESTUDOS AMBIENTAIS REPORTAR CURSO

Cursos Grátis

DIAGRAMAS CAUSAIS: FAÇA SUAS SUPOSIÇÕES ANTES DE SUAS CONCLUSÕES

Aprenda regras gráficas simples que permitem usar imagens intuitivas para melhorar o design do estudo e a análise de dados para inferência causal. Os diagramas causais revolucionaram a maneira pela qual os pesquisadores perguntam: Qual é o efeito causal de X em Y? Eles se tornaram uma ferramenta essencial para pesquisadores que estudam os efeitos de tratamentos, exposições e políticas. Ao resumir e comunicar suposições sobre a estrutura causal de um problema, os diagramas causais ajudaram a esclarecer aparentes paradoxos, a descrever vieses comuns e a identificar variáveis ??de ajuste. Como resultado, uma sólida compreensão dos diagramas causais está se tornando cada vez mais importante em muitas disciplinas científicas. A primeira parte deste curso é composta por sete lições que introduzem diagramas causais e suas aplicações à inferência causal. A primeira lição apresenta DAGs causais, um tipo de diagramas causais e as regras que os governam. A segunda, terceira e quarta lições usam DAGs causais para representar formas comuns de viés. A quinta lição usa DAGs causais para representar tratamentos que variam no tempo e feedback sobre fatores de confusão com o tratamento, bem como o viés dos métodos estatísticos convencionais para o ajuste de confusão. A sexta lição apresenta SWIGs, outro tipo de diagramas causais. A sétima lição orienta os alunos na construção de diagramas causais. A segunda parte do curso apresenta uma série de estudos de caso que destacam as aplicações práticas de diagramas causais a questões do mundo real das ciências sociais e da saúde. Crédito da foto do professor: Anders Ahlbom

HARVARD UNIVERSITY ANÁLISE DE DADOS E ESTATÍSTICA REPORTAR CURSO

INFERÊNCIA ESTATÍSTICA E MODELAGEM PARA EXPERIMENTOS DE ALTO RENDIMENTO

Foco nas técnicas comumente usadas para executar inferência estatística em dados de alto rendimento. Neste curso, você aprenderá vários tópicos estatísticos, incluindo vários problemas de teste, taxas de erro, procedimentos de controle de taxa de erro, taxas de descoberta falsa, valores q e análise exploratória de dados. Em seguida, introduzimos a modelagem estatística e como ela é aplicada aos dados de alto rendimento. Em particular, discutiremos distribuições paramétricas, incluindo binomial, exponencial e gama, e descreveremos a estimativa de probabilidade máxima. Fornecemos vários exemplos de como esses conceitos são aplicados nos dados de sequenciamento e microarray da próxima geração. Finalmente, discutiremos modelos hierárquicos e bayes empíricos, juntamente com alguns exemplos de como eles são usados ??na prática. Fornecemos exemplos de programação R de uma maneira que ajudará a fazer a conexão entre conceitos e implementação. Dada a diversidade de formação educacional de nossos alunos, dividimos a série em sete partes. Você pode fazer a série inteira ou cursos individuais que lhe interessam. Se você é estatístico, deve considerar pular os dois ou três primeiros cursos. Da mesma forma, se você é biólogo, deve pular algumas das palestras introdutórias de biologia. Observe que os aspectos estatísticos e de programação da classe aumentam com dificuldade relativamente rápida nos três primeiros cursos. No terceiro curso, serão ensinados conceitos estatísticos avançados, como modelos hierárquicos, e pelo quarto, habilidades avançadas de engenharia de software, como computação paralela e conceitos de pesquisa reproduzível. Esses cursos compõem 2 XSeries e têm ritmo individual: PH525.1x: Estatística e R para as Ciências da Vida PH525.2x: Introdução a modelos lineares e álgebra matricial PH525.3x: Inferência Estatística e Modelagem para Experimentos de Alto Rendimento PH525.4x: análise de dados de alta dimensão PH525.5x: Introdução ao biocondutor: anotação e análise de genomas e ensaios genômicos PH525.6x: Computação de alto desempenho para genômica reproduzível PH525.7x: Estudos de caso em genômica funcional Esta classe foi apoiada em parte pela concessão do NIH R25GM114818.

HARVARD UNIVERSITY ANÁLISE DE DADOS E ESTATÍSTICA REPORTAR CURSO

Cursos Grátis

INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS PARA MAPEAMENTO GENÉTICO

Aprenda sobre os métodos estatísticos usados ??para identificar variantes genéticas responsáveis ??por fenótipos. Este curso de dados é um iniciador da genética estatística e abrange uma abordagem chamada mapeamento de desequilíbrio de ligação, que analisa dados não familiares e foi usada com sucesso para identificar variantes genéticas associadas a traços genéticos comuns e complexos.

UNIVERSIDADE DE KYOTO ANÁLISE DE DADOS E ESTATÍSTICA REPORTAR CURSO

Cursos Grátis

PRINCÍPIOS, FERRAMENTAS ESTATÍSTICAS E COMPUTACIONAIS PARA CIÊNCIA DE DADOS REPRODUZÍVEIS

Aprenda habilidades e ferramentas que suportam ciência de dados e pesquisa reproduzível, para garantir que você possa confiar em seus próprios resultados de pesquisa, reproduzi-los e comunicá-los a outras pessoas. Hoje, os princípios e técnicas da pesquisa reproduzível são mais importantes do que nunca, em diversas disciplinas, da astrofísica à ciência política. Ninguém quer fazer pesquisas que não possam ser reproduzidas. Portanto, este curso é realmente para quem está realizando uma pesquisa intensiva em dados. Embora muitos de nós venham de uma formação biomédica, este curso é para uma ampla audiência de cientistas de dados. Para atender às necessidades da comunidade científica, este curso examinará os fundamentos dos métodos e ferramentas para a pesquisa reproduzível. Liderados por professores experientes da Harvard TH Chan School of Public Health, você participará de seis módulos que incluirão vários estudos de caso que ilustram o impacto significativo dos métodos de pesquisa reproduzíveis nas descobertas científicas. Este curso atrairá estudantes e profissionais em bioestatística, biologia computacional, bioinformática e ciência de dados. O conteúdo do curso combinará palestras em vídeo, estudos de caso, compromissos ponto a ponto e uso de ferramentas e plataformas computacionais (como R / RStudio e Git / Github), culminando na apresentação final de um projeto de pesquisa reproduzível final. Abordaremos Fundamentos da ciência reprodutível; Estudos de caso; Proveniência de dados; Métodos Estatísticos para Ciência Reprodutível; Ferramentas computacionais para ciência reproduzível; e Reprodutible Reporting Science. Esses conceitos destinam-se a traduzir para campos nas ciências dos dados: ciências físicas e da vida, matemática aplicada e estatística e computação. Considere este curso uma pesquisa de melhores práticas: gostaríamos de informá-lo sobre as armadilhas da ciência de dados reproduzíveis, algumas histórias de fracasso - e sucesso - no passado e ferramentas e padrões de design que podem ajudar a facilitar tudo. Mas, em última análise, cabe a você adotar as habilidades aprendidas neste curso para criar seu próprio ambiente, no qual você pode realizar facilmente pesquisas reproduzíveis, além de incentivar e integrar ambientes semelhantes para seus colaboradores e colegas. Esperamos vê-lo neste curso e nas pesquisas que realizar no futuro!

HARVARD UNIVERSITY ANÁLISE DE DADOS E ESTATÍSTICA REPORTAR CURSO

Cursos Grátis