<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	>

<channel>
	<title>Suporte à Decisão</title>
	<atom:link href="http://www.suportedecisao.com/feed" rel="self" type="application/rss+xml" />
	<link>http://www.suportedecisao.com</link>
	<description>Datawarehouse, Data Mining, Olap e Suporte à Decisão</description>
	<pubDate>Tue, 07 Apr 2009 18:14:31 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.7</generator>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>Técnicas e Algoritmos para Data Mining</title>
		<link>http://www.suportedecisao.com/tecnicas-e-algoritmos-para-data-mining</link>
		<comments>http://www.suportedecisao.com/tecnicas-e-algoritmos-para-data-mining#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:38:10 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=40</guid>
		<description><![CDATA[A abordagem clássica consiste em usar  as eficientes e sintetizadoras fórmulas estatísticas para pesquisa e visualização de resultados, mas a estatística tem duas grandes desvantagens: a primeira é a dificuldade em apresentar resultados em tempo útil devido à dimensão dos Warehouses. A segunda, e parece-nos a mais relevante, é a de &#8220;esconder&#8221; ou omitir [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">A abordagem clássica consiste em usar  as eficientes e sintetizadoras fórmulas estatísticas para pesquisa e visualização de resultados, mas a estatística tem duas grandes desvantagens: a primeira é a dificuldade em apresentar resultados em tempo útil devido à dimensão dos Warehouses. A segunda, e parece-nos a mais relevante, é a de &#8220;esconder&#8221; ou omitir informação que pode ser importante ao retirar &#8220;apenas&#8221; amostras do conjunto de dados e perder assim informação de subconjuntos não usados.</p>
<p align="justify">Resumimos aqui as técnicas e algoritmos mais usados:</p>
<p align="justify">
<p align="justify">
<p align="justify">&#8220;Market Basket Analysis&#8221; (MBA)</p>
<p align="justify">A análise do cabaz de compras permite inferir regras a partir de grupos de itens ou produtos que surgem numa transacção (ou compra) do ponto-de-venda.</p>
<p align="justify">Sendo as transacções anónimas, esta técnica serve para analisar produtos juntamente com a localização geográfica e a partir daí promover investimentos em determinados produtos em zonas diferentes. Se as transacções não forem anónimas e soubermos a identificação dos clientes, então podemos traçar perfis para promoções directas e personalizadas.</p>
<p align="justify">
<p align="justify">&#8220;Memory-Based Reasoning&#8221; (MBR)</p>
<p align="justify">Uso das instâncias conhecidas como modelo para aferir e fazer previsões de instâncias desconhecidas. Ou seja, para determinarmos se vale a pena investigar mais num &#8220;alvo&#8221;, recolhemos informação sobre os seus &#8220;vizinhos&#8221; similares e consoante o &#8220;estado&#8221; dos vizinhos tomamos uma decisão. A fiabilidade da opção dependerá da distância a que estiverem os &#8220;alvos vizinhos&#8221;.</p>
<p align="justify">Pode ser utilizado com quase todos os tipos de dados, o que é uma grande vantagem desta técnica e também apreende novas classificações apenas com a introdução de novas instâncias na base de dados.</p>
<p align="justify">
<p align="justify">&#8220;Cluster Detection&#8221; (CD)</p>
<p align="justify">Detecção de grupos de registos similares. Esta técnica permite construir modelos para a pesquisa de registos que são similares.</p>
<p align="justify">Esta é uma forma indirecta de fazer Data Mining, pois a pesquisa de informação para agregar registos similares é uma primeira fase para entender que tipos de dados é que temos.</p>
<p align="justify">
<p align="justify">&#8220;Link Analysis&#8221; (LA)</p>
<p align="justify">Análise de relações entre os vários registos da base de dados com o objectivo de construir modelos baseados nos padrões existentes nessas relações. Sendo uma ferramenta de Data Mining directa, não é muito eficiente para a pesquisa em Bases de Dados relacionais.</p>
<p align="justify">
<p align="justify">&#8220;Decision Trees and Rule Induction&#8221; (DTRI)</p>
<p align="justify">Aferência de regras e árvores de decisão. Esta técnica de Data Mining directa consiste na criação e treino de subconjuntos disjuntos de informação para os quais é aferida uma regra  num ou mais campos do registo (record).</p>
<p align="justify">Tem a vantagem de ser bastante explícita e de se poder usar Structured Query Language (SQL) como linguagem de pesquisa, pois a lógica das regras é bastante simples.</p>
<p align="justify">
<p align="justify">&#8220;Artificial Neural Networks&#8221; (ANN)</p>
<p align="justify">As redes neuronais são uma das técnicas mais conhecidas e usadas em Data Mining. Utilizam um modelo idêntico ao dos neurónios e as suas ligações (sinapses) no cérebro humano como suporte para aumentarem o seu volume de dados. Apreendem a partir do &#8220;treino&#8221; sobre esses dados, generalizando padrões e aplicando-os, internamente, para classificação e previsão de resultados.</p>
<p align="justify">É uma técnica excelente, muito vantajosa, mas que tem dois aspectos negativos: o primeiro é a complexidade dos modelos gerados. O segundo é o problema de exigir que o formato dos dados seja imutável; para diferentes representações dos dados surgem resultados diferentes, portanto existe um trabalho importante a fazer na preparação dos dados.</p>
<p align="justify">
<p align="justify">
<p align="justify">
<p align="justify">&#8220;Genetic Algorithms&#8221; (GA)</p>
<p align="justify">É uma técnica que utiliza o &#8220;algoritmo&#8221; natural, ou seja, os mecanismos de selecção que a natureza utiliza para a evolução das espécies.</p>
<p align="justify">Tem como ponto forte o seu modo de funcionamento estatístico, o qual utiliza a selecção, o cruzamento de dois indivíduos e a mutação para seleccionar as possíveis soluções que prevalecerão para uma próxima geração até convergir na solução óptima (difícil de atingir mas podemos aproximarmo-nos o suficiente).</p>
<p align="justify">É uma excelente técnica de optimização para ser utilizada em complemento às técnicas de MBR ou de Redes Neuronais.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/tecnicas-e-algoritmos-para-data-mining/feed</wfw:commentRss>
		</item>
		<item>
		<title>Data Mining</title>
		<link>http://www.suportedecisao.com/data-mining</link>
		<comments>http://www.suportedecisao.com/data-mining#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:36:11 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=39</guid>
		<description><![CDATA[Qualquer sistema de Datawarehouse apenas funciona e pode ser utilizado plenamente com boas ferramentas de exploração. Com o aparecimento do Datawarehouse a tecnologia de Data Mining (extracção de dados) também ganhou a atenção do mercado.
Como o Datawarehouse possui Bases de Dados bem organizadas e consolidadas, as ferramentas de Data Mining ganharam grande importância e utilidade. [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">Qualquer sistema de Datawarehouse apenas funciona e pode ser utilizado plenamente com boas ferramentas de exploração. Com o aparecimento do Datawarehouse a tecnologia de Data Mining (extracção de dados) também ganhou a atenção do mercado.</p>
<p align="justify">Como o Datawarehouse possui Bases de Dados bem organizadas e consolidadas, as ferramentas de Data Mining ganharam grande importância e utilidade. Essa técnica, orientada para a extracção de dados, oferece uma poderosa alternativa para as empresas descobrirem novas oportunidades de negócio e acima de tudo, traçarem novas estratégias para o futuro.</p>
<p align="justify">O objectivo da análise de dados é descobrir, previamente, características dos dados, sejam relações, dependências ou tendências desconhecidas. Tais descobertas tornam-se parte da estrutura de informação que constituem a base das tomadas de decisão. Uma típica ferramenta de análise de dados ajuda os utilizadores finais na definição do problema, na selecção de dados e a iniciar uma correcta análise para a criação da informação, que ajudará a resolver problemas descobertos. Noutras palavras, o utilizador final reage a um estímulo externo e à descoberta do problema por ele mesmo.</p>
<p align="justify">A premissa do Data Mining é uma argumentação activa, isto é, em vez do utilizador definir o problema, seleccionar os dados e as ferramentas para analisar tais dados, as ferramentas de Data Mining pesquisam automaticamente os mesmos à procura de anomalias e possíveis relações, identificando assim problemas que não tinham sido detectados pelo utilizador. Noutras palavras, as ferramentas de Data Mining analisam os dados, descobrem problemas ou oportunidades escondidas nos relacionamentos dos mesmos e diagnosticam o comportamento dos negócios, requerendo a mínima intervenção do utilizador, dedicando-se este somente à procura de informação e à descoberta de mais vantagens competitivas.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/data-mining/feed</wfw:commentRss>
		</item>
		<item>
		<title>ETL (Extracção, Transformação e Carregamento dos Dados)</title>
		<link>http://www.suportedecisao.com/etl-extraccao-transformacao-e-carregamento-dos-dados</link>
		<comments>http://www.suportedecisao.com/etl-extraccao-transformacao-e-carregamento-dos-dados#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:35:35 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=38</guid>
		<description><![CDATA[A etapa de ETL (&#8221;Extract, Transform and Load&#8221; - Extracção, Transformação e Carregamento) é uma das mais críticas num projecto de Datawarehouse, pois uma informação carregada erradamente trará consequências imprevisíveis nas fases posteriores. O objectivo desta fase é fazer a integração de informações de fontes múltiplas e complexas. Basicamente, divide-se esta etapa em três passos: [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">A etapa de ETL (&#8221;Extract, Transform and Load&#8221; - Extracção, Transformação e Carregamento) é uma das mais críticas num projecto de Datawarehouse, pois uma informação carregada erradamente trará consequências imprevisíveis nas fases posteriores. O objectivo desta fase é fazer a integração de informações de fontes múltiplas e complexas. Basicamente, divide-se esta etapa em três passos: extracção, transformação e carregamento dos dados. Embora tenhamos hoje em dia ferramentas que auxiliam na execução do trabalho, ainda assim é um processo trabalhoso, complexo e também muito detalhado.</p>
<ul>
<li>
<p align="justify">Carregamento. Num processo de ETL, devemos definir em primeiro lugar 	as origens das fontes de dados e fazer a extracção dos 	mesmos. As origens podem ser várias e provenientes de 	diferentes formatos, onde poderemos encontrar desde os sistemas 	transaccionais das empresas (por exemplo: SAP, BPCS, etc.) até 	arquivos de texto e arquivos DBF (&#8221;dBase&#8221;) ou Microsoft Access.</p>
</li>
<li>
<p align="justify">Limpeza. 	Definidas as fontes, partimos para o segundo passo que consiste em 	transformar e limpar esses dados. A limpeza é necessária, 	porque os dados normalmente provêm, muitas vezes, de uma fonte 	desconhecida, concebida há muito tempo, contendo muito lixo e 	inconsistências. Por exemplo: se a empresa vender cartões 	de crédito (Citibank ou outras), o vendedor está mais 	preocupado em vender o produto (cartão) do que na qualidade 	de dados que está a inserir. Se o cliente não facultar 	o número do telefone na altura da compra, o vendedor 	introduzirá um número qualquer para agilizar a venda. 	Se for feita uma consulta posterior, levando-se em conta o número 	do telefone dos clientes, no mínimo informações 	como: número 99999999-99 poderão aparecer. Por isso, 	nessa fase do Datawarehouse, faz-se a limpeza desses dados, para 	haver compatibilidade entre eles.</p>
</li>
<li>
<p align="justify">Transformação. Uma vez que os dados pode ter origem em 	sistemas diferentes, às vezes é necessário 	padronizar os diferentes formatos. Por exemplo: em alguns sistemas, 	a informação sobre o sexo do cliente pode estar 	armazenada no seguinte formato : &#8220;M&#8221; para Masculino e &#8220;F&#8221; 	para Feminino. Porém, em algum outro sistema pode estar 	guardado como &#8220;H&#8221; para Masculino e &#8220;M&#8221; para Feminino e assim 	sucessivamente. Quando levamos esses dados para o Datawarehouse, 	deve-se ter uma padronização deles, ou seja, quando o 	utilizador for consultar o Datawarehouse, ele não pode ver 	informações iguais em formatos diferentes. Portanto, 	fazemos o processo de ETL, transformamos esses dados e deixamos num 	formato uniforme normalmente sugerido pelo próprio 	utilizador. No Datawarehouse, teremos somente M e F, facto esse que 	facilitará a análise dos dados que serão 	recuperados pela ferramenta OLAP.</p>
</li>
</ul>
<p align="justify">Apesar de existirem ferramentas de ETL como o &#8220;Data Stage&#8221; (Ardent/Informix), o DTS (Microsoft) e o &#8220;Sagent&#8221; (da própria Sagent), às vezes é necessário criar rotinas de carga para atender determinadas situações que poderão ocorrer. Todos têm as suas características e cada um poderá ser utilizado dependendo do caso de cada empresa. O mais importante é que uma ferramenta de ETL tem grande valia, principalmente se os sistemas OLTP (transaccionais) são muitos, pois elas são uma poderosa fonte de geração de metadados e podem contribuir muito para a produtividade da equipa.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/etl-extraccao-transformacao-e-carregamento-dos-dados/feed</wfw:commentRss>
		</item>
		<item>
		<title>Metadados</title>
		<link>http://www.suportedecisao.com/metadados</link>
		<comments>http://www.suportedecisao.com/metadados#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:32:50 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=37</guid>
		<description><![CDATA[Os metadados são definidos como dados dos dados, informações das informações. Dada a complexidade das informações de um Datawarehouse, a documentação dos sistemas e das bases de dados tornou-se de vital importância. Este tipo de registo já era tido como muito importante desde o surgimento das primeiras bases de dados. Com o Datawarehouse, tornou-se fundamental; [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">Os metadados são definidos como dados dos dados, informações das informações. Dada a complexidade das informações de um Datawarehouse, a documentação dos sistemas e das bases de dados tornou-se de vital importância. Este tipo de registo já era tido como muito importante desde o surgimento das primeiras bases de dados. Com o Datawarehouse, tornou-se fundamental; em grandes projectos, se não houver uma documentação eficiente, o mais certo é mais ninguém conseguir manter o sistema.</p>
<p align="justify">Num projecto de Datawarehouse, deve-se gerar documentação sobre o levantamento de dados, da base de dados, relatórios a serem gerados, origem dos dados que alimentam o Datawarehouse, processos de extracção, tratamento e rotinas de carga dos dados, além de, possivelmente, regras de negócio da empresa e todas as suas mudanças.</p>
<p align="justify">Segundo Inmon, os metadados englobam o Datawarehouse e mantém as informações sobre o que está onde. O autor ainda define quais as informações que os metadados devem manter:</p>
<ul>
<li> A estrutura dos dados segundo a visão do 	programador;</li>
<li> A 	estrutura dos dados segundo a visão dos analista de SAD;</li>
<li> A 	fonte de dados que alimenta o Datawarehouse;</li>
<li> A 	transformação sofrida pelos dados no momento da sua 	migração para o Datawarehouse;</li>
<li> O modelo de 	dados;</li>
<li> O 	relacionamento entre o modelo de dados e o Datawarehouse;</li>
<li>O 	histórico das extracções de dados;</li>
<li>Os dados referentes aos relatórios que 	são gerados pelas ferramentas OLAP, assim como os que são 	gerados nas camadas semânticas.</li>
</ul>
<p align="justify">
<p align="justify">Os metadados podem surgir de vários locais durante o decorrer dos projectos. Desde o material que tem origem nas reuniões com os utilizadores até à documentação dos sistemas operacionais. Aliás, as reuniões tornam-se, muitas vezes, uma fonte preciosa de informações, pois muitos dados levantados não estão (e não estariam) documentados em nenhum outro local. Nesta fase, deve-se definir, inclusive, as regras para validação dos dados após carregamento no Datawarehouse.</p>
<p align="justify">Como pudemos ver, o volume de metadados gerados é muito grande. Existem hoje algumas ferramentas que fazem única e exclusivamente a gestão dos metadados. Elas têm algumas características peculiares. Essas ferramentas conseguem mapear as informações em todas as etapas de desenvolvimento dos projectos, desde a conceptual até à de visualização dos dados em ferramentas OLAP/EIS.</p>
<p align="justify">Uma regra de boa implementação de um projecto de Datawarehouse diz que devemos sempre ter muita atenção aos metadados, pois são eles que servirão de guia por entre as brumas das tabelas, relatórios e dados quando estivermos perdidos.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/metadados/feed</wfw:commentRss>
		</item>
		<item>
		<title>Data Mart</title>
		<link>http://www.suportedecisao.com/data-mart</link>
		<comments>http://www.suportedecisao.com/data-mart#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:31:06 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=36</guid>
		<description><![CDATA[Os primeiros projectos de Datawarehouse  referiam-se a uma arquitectura centralizada. Embora seja interessante para fornecer uniformidade, controle e maior segurança, a implementação desta abordagem não é uma tarefa fácil. Requer uma metodologia rigorosa e uma completa compreensão dos negócios da empresa. Esta abordagem pode ser longa e dispendiosa e por isto a sua implementação exige [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">Os primeiros projectos de Datawarehouse  referiam-se a uma arquitectura centralizada. Embora seja interessante para fornecer uniformidade, controle e maior segurança, a implementação desta abordagem não é uma tarefa fácil. Requer uma metodologia rigorosa e uma completa compreensão dos negócios da empresa. Esta abordagem pode ser longa e dispendiosa e por isto a sua implementação exige um planeamento correcto e detalhado.</p>
<p align="justify">Com o aparecimento do Data Mart ou Warehouse departamental, a abordagem descentralizada passou a ser uma das opções da arquitectura Datawarehouse<em>. </em>Os Data Marts podem surgir de duas maneiras. A primeira é &#8220;top-down&#8221; e a segunda é &#8220;bottom-up&#8221;.</p>
<ul>
<li>
<p align="justify">&#8220;Top-down&#8221;: 	quando a empresa cria um  Datawarehouse e depois parte para a 	segmentação, ou seja, divide o Datawarehouse em áreas 	menores formando assim pequenos bancos de dados orientados por 	assuntos departamentalizados.</p>
</li>
</ul>
<ul>
<li>
<p align="justify">&#8220;Bottom-up&#8221;: 	quando a situação é inversa. A empresa por 	desconhecer a tecnologia, cria uma Base de Dados somente para uma 	área. Com isso os custos são menores do que num 	projecto de Datawarehouse completo. A partir da visualização 	dos primeiros resultados parte-se para outra área e assim 	sucessivamente até estar criado um verdadeiro Datawarehouse.</p>
</li>
</ul>
<p align="justify">A tecnologia usada tanto no Datawarehouse como no Data Mart é a mesma, as variações que ocorrem são mínimas, quer em tipo de dados quer na complexidade da carga. A principal diferença é a de que os Data Marts são voltados somente para uma determinada área e o Datawarehouse é voltado para os assuntos de toda a empresa. Cabe portanto a cada empresa avaliar a sua procura e optar pela melhor solução.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/data-mart/feed</wfw:commentRss>
		</item>
		<item>
		<title>Critérios para um Datawarehouse</title>
		<link>http://www.suportedecisao.com/criterios-para-um-datawarehouse</link>
		<comments>http://www.suportedecisao.com/criterios-para-um-datawarehouse#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:30:50 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=35</guid>
		<description><![CDATA[Os critérios para Datawarehouse RDBMS são :


Performance de carregamento - os Datawarehouses 	requerem um carregamento com incremento de novos dados numa base 	periódica, dentro de janelas de tempo estreitas; o desempenho 	do processo de carga deve ser medido em centenas de milhões 	de linhas de registo e &#8220;gigabytes&#8221; por hora e não deve, 	artificialmente, constranger [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">Os critérios para Datawarehouse RDBMS são :</p>
<ul>
<li>
<p align="justify">Performance de carregamento - os Datawarehouses 	requerem um carregamento com incremento de novos dados numa base 	periódica, dentro de janelas de tempo estreitas; o desempenho 	do processo de carga deve ser medido em centenas de milhões 	de linhas de registo e &#8220;gigabytes&#8221; por hora e não deve, 	artificialmente, constranger o volume de dados requeridos pelo 	negócio;</p>
</li>
</ul>
<p align="justify">Processamento de carga - existem alguns  passos que devem ser levados em linha de conta para carregar dados novos ou actualizados no Datawarehouse, incluindo conversões de dados, filtragem, reformatação, confirmação de integridade, armazenamento físico, indexação e actualização de dados. Estes passos devem ser executados como uma única unidade de trabalho.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/criterios-para-um-datawarehouse/feed</wfw:commentRss>
		</item>
		<item>
		<title>Problemas com o Datawarehouse</title>
		<link>http://www.suportedecisao.com/problemas-com-o-datawarehouse</link>
		<comments>http://www.suportedecisao.com/problemas-com-o-datawarehouse#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:30:31 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=34</guid>
		<description><![CDATA[Um dos problemas relacionados com o software de Datawarehouse foi a pressa das empresas em colocá-lo no mercado o mais rapidamente possível. &#8220;Estas companhias menosprezaram a etiqueta &#8220;Datawarehouse&#8221; em produtos de tradicional transacção/processamento e adoptaram o léxico da indústria para serem considerados &#8220;players&#8221; nesta categoria de rápido crescimento.&#8221; - Chris Erickson, Presidente e CEO de [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">Um dos problemas relacionados com o software de Datawarehouse foi a pressa das empresas em colocá-lo no mercado o mais rapidamente possível. &#8220;Estas companhias menosprezaram a etiqueta &#8220;Datawarehouse&#8221; em produtos de tradicional transacção/processamento e adoptaram o léxico da indústria para serem considerados &#8220;players&#8221; nesta categoria de rápido crescimento.&#8221; - <em>Chris Erickson, Presidente e CEO de Red Brick (HPCwire, Oct. 13, 1995)</em></p>
<p align="justify">Os sistemas da &#8220;Red Brick&#8221; estabeleceram um critério para um sistema de administração de Base de Dados relacional (RDBMS) satisfatório para Datawarehouse e documentaram 10 exigências especializadas para um RDBMS se qualificar como um servidor relacional de Datawarehouse. Este critério é ilustrado no próximo ponto.</p>
<p align="justify">De acordo com a &#8220;Red Brick&#8221;, as exigências para um Datawarehouse RDBMS começam com o carregamento e preparação dos dados para &#8220;queries&#8221; e análises. Se o &#8220;desenhador/consultor&#8221; desconhece o critério nesta fase o resto do sistema será inexacto, incerto e indisponível.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/problemas-com-o-datawarehouse/feed</wfw:commentRss>
		</item>
		<item>
		<title>Um modelo de Datawarehouse</title>
		<link>http://www.suportedecisao.com/um-modelo-de-datawarehouse</link>
		<comments>http://www.suportedecisao.com/um-modelo-de-datawarehouse#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:29:47 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=33</guid>
		<description><![CDATA[O Datawarehouse é o processo de extrair e transformar dados operacionais em dados de informação e carregá-los numa loja de dados central ou Warehouse. Uma vez que os dados estejam carregados são acessíveis por &#8220;queries&#8221; de &#8220;desktop&#8221; e ferramentas de análise.
Os dados dentro do actual Warehouse têm uma estrutura distinta com ênfase em níveis diferentes [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">O Datawarehouse é o processo de extrair e transformar dados operacionais em dados de informação e carregá-los numa loja de dados central ou Warehouse. Uma vez que os dados estejam carregados são acessíveis por &#8220;queries&#8221; de &#8220;desktop&#8221; e ferramentas de análise.</p>
<p align="justify">Os dados dentro do actual Warehouse têm uma estrutura distinta com ênfase em níveis diferentes de resumo.</p>
<p align="justify">Os dados correntes detalhados são importantes porque:</p>
<ul>
<li>
<p align="justify">reflectem os mais recentes acontecimentos que normalmente são 	os mais interessantes;</p>
</li>
</ul>
<ul>
<li>
<p align="justify">são volumosos porque são armazenados ao mais baixo 	nível de granularidade;</p>
</li>
</ul>
<ul>
<li>
<p align="justify">São quase sempre armazenados em unidades de disco de acesso 	rápido.</p>
</li>
</ul>
<p align="justify">Os dados detalhados mais antigos são arquivados e, não sendo frequentemente utilizados, são armazenados num nível detalhado consistente com os dados correntes detalhados.</p>
<p align="justify">Os dados resumidos são dados seleccionados do mais baixo nível de detalhe encontrado e, geralmente, são armazenados em unidades de disco.</p>
<p align="justify">Os dados altamente resumidos são compactos, facilmente acessíveis e podem ser encontrados até mesmo fora do Warehouse.</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/um-modelo-de-datawarehouse/feed</wfw:commentRss>
		</item>
		<item>
		<title>Datawarehouse e sistemas OLTP</title>
		<link>http://www.suportedecisao.com/datawarehouse-e-sistemas-oltp</link>
		<comments>http://www.suportedecisao.com/datawarehouse-e-sistemas-oltp#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:29:28 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=32</guid>
		<description><![CDATA[Os sistemas OLTP (&#8221;On Line Transaction Processing&#8221;) utilizados em soluções de Datawarehouse são muito bons para armazenar informações em BD de forma rápida, eficiente e segura, mas deixam muito a desejar em relação à extracção e análise qualitativa das informações. Por essas razões, as técnicas e ferramentas de Data Mining podem trazer grandes resultados para [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">Os sistemas OLTP (&#8221;On Line Transaction Processing&#8221;) utilizados em soluções de Datawarehouse são muito bons para armazenar informações em BD de forma rápida, eficiente e segura, mas deixam muito a desejar em relação à extracção e análise qualitativa das informações. Por essas razões, as técnicas e ferramentas de Data Mining podem trazer grandes resultados para as empresas que as adoptarem. Por outro lado, se os projectos de Data Mining forem mal planeados e implementados, também se podem tornar simplesmente uma decepção. Embora as técnicas e ferramentas de Data Mining estejam ainda muito imaturas, muitas empresas já têm investido e usado satisfatoriamente essa tecnologia.</p>
<p align="justify">Uma Base de Dados que é construída para processamento de transacções on-line, OLTP, geralmente é considerada inadequada para um Datawarehouse, pois foi projectada com um conjunto diferente de necessidades e com a sua capacidade processual maximizada.</p>
<p align="justify">O Datawarehouse é interessante no processamento de &#8220;queries&#8221; e não na referida execução de transacções.</p>
<p align="justify">Os servidores de Datawarehouse têm uma finalidade diferente da dos sistemas de OLTP, pois permitem responder a questões de análise empresariais em vez de &#8220;agregações&#8221; simples como &#8220;qual o saldo actual da conta para este cliente?&#8221; Questões típicas de Datawarehouse incluem tais coisas como &#8220;Que linha de produto vende melhor e como é que isso corresponde a dados demográficos?&#8221;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/datawarehouse-e-sistemas-oltp/feed</wfw:commentRss>
		</item>
		<item>
		<title>Processos num Datawarehouse</title>
		<link>http://www.suportedecisao.com/processos-num-datawarehouse</link>
		<comments>http://www.suportedecisao.com/processos-num-datawarehouse#comments</comments>
		<pubDate>Wed, 16 Jul 2008 16:29:07 +0000</pubDate>
		<dc:creator>Shenron</dc:creator>
		
		<category><![CDATA[Conceitos Chave]]></category>

		<guid isPermaLink="false">http://www.suportedecisao.com/?p=31</guid>
		<description><![CDATA[A primeira fase do Datawarehouse é &#8220;separar&#8221; a sua informação operacional actual, para preservar a segurança e a integridade das aplicações OLTP (&#8221;On Line Transaction Processing&#8221;) de máxima importância, enquanto dá ao utilizador acesso à Base de Dados. A base de dados resultante ou Datawarehouse pode consumir centenas de &#8220;Gigabytes&#8221;, ou até &#8220;Terabytes&#8221;, de espaço [...]]]></description>
			<content:encoded><![CDATA[<p align="justify">A primeira fase do Datawarehouse é &#8220;separar&#8221; a sua informação operacional actual, para preservar a segurança e a integridade das aplicações OLTP (&#8221;On Line Transaction Processing&#8221;) de máxima importância, enquanto dá ao utilizador acesso à Base de Dados. A base de dados resultante ou Datawarehouse pode consumir centenas de &#8220;Gigabytes&#8221;, ou até &#8220;Terabytes&#8221;, de espaço de disco e requer técnicas eficientes para armazenar e recuperar quantidades volumosas de informação. Cada vez maiores, as organizações acham que somente sistemas de processamento paralelo oferecem largura de banda suficiente.</p>
<p align="justify">O Datawarehouse recupera assim dados de uma variedade de bases de dados operacionais heterogéneas. Os dados são transformados e são entregues ao &#8220;Warehouse/Store&#8221; (armazém)de dados baseado num modelo seleccionado (ou definição traçada). A transformação dos dados e a movimentação dos processos são executados sempre que é requerida uma actualização para os dados do Datawarehouse, devendo existir alguma forma de automatização para administrar e executar estas funções.</p>
<p align="justify">A limpeza dos dados é um aspecto importante para a criação de um Datawarehouse eficiente, naquilo que é a remoção de certos aspectos dos dados operacionais, como a informação de transacção de baixo nível que permite baixar os tempos das consultas.</p>
<p align="justify">A fase de limpeza tem que ser tão dinâmica quanto possível, para acomodar todos os tipos de &#8220;queries&#8221;, até mesmo aqueles que podem requerer informação de baixo nível. Os dados devem ser extraídos das fontes de produção em intervalos regulares e devem ser agrupados centralmente, mas o processo de limpeza tem que remover a duplicação e reconciliar diferenças entre os vários estilos de colecção de dados.</p>
<p align="justify">Uma vez limpos os dados, eles são então transferidos para o Datawarehouse que tipicamente ou é uma grande Base de Dados de alto desempenho SMP (&#8221;Symmetrical Multi Processing&#8221;) ou MPP (&#8221;Massive Parallel Processing&#8221;).</p>
<p align="justify">O poder de análise dos números é outro aspecto importante do Datawarehouse, devido à complexidade envolvida no processamento de &#8220;queries ad-hoc&#8221; e por causa das vastas quantidades de dados que a organização quer usar no Warehouse. Um Datawarehouse pode ser utilizado de modos diferentes, como por exemplo, uma &#8220;loja central&#8221; na qual as &#8220;queries&#8221; são executadas ou como um &#8220;mercado de dados&#8221;.</p>
<p align="justify">A aproximação da loja central, geralmente, usa uma estrutura de dados muito simples com muito pequenas suposições sobre as relações entre os dados, enquanto que os mercados usam frequentemente Bases de Dados multidimensionais que podem acelerar o processamento de &#8220;queries&#8221;.</p>
<p align="justify">Uma aproximação ao Datawarehouse é o &#8220;Paradigma da Sandwich&#8221; de Parsaye, avançado pelo Dr. Kamran Parsaye, CEO da Hermosa Beach, CA. Este paradigma ou filosofia encoraja a aceitação da probabilidade de que a primeira repetição de um esforço de Datawarehouse requererá uma revisão considerável. Desta forma e para evitar estas revisões caras e demoradas o &#8220;Paradigma da Sandwich&#8221; defende a seguinte aproximação:</p>
<ul>
<li>
<p align="justify">Trabalho dos dados para determinar que formatos e dados são 	necessários para apoiar uma aplicação de Data 	Mining;</p>
</li>
</ul>
<ul>
<li>
<p align="justify">Construção de um protótipo de mini 	Datawarehouse, com a maioria das características imaginadas 	para o produto final;</p>
</li>
</ul>
<ul>
<li>
<p align="justify">Revisão das estratégias;</p>
</li>
</ul>
<ul>
<li>
<p align="justify">Construção do &#8220;Warehouse&#8221;(armazém) 	final.</p>
</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://www.suportedecisao.com/processos-num-datawarehouse/feed</wfw:commentRss>
		</item>
	</channel>
</rss>

