http://repositorio.unb.br/handle/10482/34423
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2018_LucasBenevidesDias.pdf | 4,37 MB | Adobe PDF | Visualizar/Abrir |
Título: | Auto-Tuning de banco de dados NoSQL com dados de Internet das Coisas : um estudo de caso com o Cassandra |
Autor(es): | Dias, Lucas Benevides |
Orientador(es): | Holanda, Maristela Terto de |
Assunto: | Internet das Coisas (IoT) Banco de dados NoSQL (Not Only SQL) Séries temporais |
Data de publicação: | 23-Abr-2019 |
Data de defesa: | 21-Jun-2018 |
Referência: | DIAS, Lucas Benevides. Auto-Tuning de banco de dados NoSQL com dados de Internet das Coisas: um estudo de caso com o Cassandra. 2018. xi, 75 f., il. Dissertação (Mestrado em Informática)—Universidade de Brasília, Brasília, 2018. |
Resumo: | Os dados provenientes de um ambiente de Internet das Coisas (IoT - Internet of Things) podem atingir um volume muito grande, proporcional à quantidade de dados gerados pelos sensores, à sua periodicidade de envio e ao número de dispositivos conectados. Estes dados são séries temporais e possuem características específicas que podem ser exploradas para facilitar seu armazenamento. Há sistemas gerenciadores de bancos de dados que possuem funcionalidades específicas para armazenar estes dados, entre eles está o banco NoSQL Cassandra, o qual provê duas estratégias de compactação, que organizam as páginas de dados de maneira otimizada para dados de séries temporais, como os de IoT. Este trabalho compara as duas estratégias e encontra a mais eficiente quanto ao tempo de resposta e throughput. A estratégia de compactação possui parâmetros de configuração, cuja definição fica a cargo do usuário. O efeito destes parâmetros no desempenho do sistema é estudado e pontos ótimos de configuração são definidos, por meio de testes e análises de resultados. Um mecanismo de auto-tuning chamado C*DynaConf foi desenvolvido, baseado nos pontos ótimos de configuração preestabelecidos. Os resultados apontaram que seu uso trouxe melhoria média de 4,52% no número de operações realizadas, quando comparado a um cenário de IoT que se inicia com configuração ótima, mas passa a ter suas características alteradas. |
Abstract: | Data provided by Internet of Things (IoT) may achieve very great volumes, proportional to the amount of data generated by sensors, to its periodicity and to the number of devices connected. This data, that is a case of time series, has some specific characteristics that can be used to favour its storage. There are some database management systems that provide mechanisms that are proper to time series data storage, between those is the NoSQL Cassandra database. These mechanisms in Cassandra are two compaction strategies, that organize data pages in an optimized way, in order to take advantage of IoT Data peculiarities. This work compares the two compaction strategies and finds the mos efficient in terms of response time and throughput. The compaction strategy has parameters that supply the configuration to the users. The effect of these parameters in performance is studied and optimal configuration points are defined, through tests and results analysis. An auto-tuning engine, called C*DynaConf was developed, based on the optimal configuration points obtained. The results show that the use of the engine has brought a 4.52% mean gain in terms of operations performed, when compared to an IoT test case where the initial configuration is optimal but the scenario’s characteristics are variated. |
Unidade Acadêmica: | Instituto de Ciências Exatas (IE) Departamento de Ciência da Computação (IE CIC) |
Informações adicionais: | Dissertação (mestrado)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2018. |
Programa de pós-graduação: | Programa de Pós-Graduação em Informática |
Licença: | A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data. |
Aparece nas coleções: | Teses, dissertações e produtos pós-doutorado |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.