Compression of point clouds attributes

Sandri, Gustavo Luiz

Use este identificador para citar ou linkar para este item: http://repositorio.unb.br/handle/10482/38462

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2019_GustavoLuizSandri.pdf		23,19 MB	Adobe PDF	Visualizar/Abrir

Título:	Compression of point clouds attributes
Outros títulos:	Codificação de atributos de nuvens de pontos
Autor(es):	Sandri, Gustavo Luiz
Orientador(es):	Queiroz, Ricardo Lopes de
Assunto:	Nuvem de pontos Compressão Compressão de imagem
Data de publicação:	30-Jun-2020
Data de defesa:	16-Dez-2019
Referência:	SANDRI, Gustavo Luiz. Compression of Point Clouds Attributes. 2019. 111 f., il. Tese (Doutorado em Engenharia de Sistemas Eletrônicos e Automação) — Universidade de Brasília, Brasília, 2019.
Resumo:	As nuvens de pontos ganharam a atenção da comunidade para aplicações em tempo real, como telepresença e navegação autônoma. A Region-Adaptive Hierarchical Transform foi introduzida como um algoritmo de baixa complexidade para a compressão de nuvens de pontos. Ela apresenta um desempenho competitivo com algoritmos de última geração. No trabalho original, a Region-Adaptive Hierarchical Transform utiliza um codificador arit- mético para codificar entropicamente os coeficientes quantizados. Observamos que o desempenho do codificador de entropia pode ser melhorado, sem prejudicar a complexidade, através da orde- nação dos coeficientes e usando o codificador Run-Length Golomb-Rice, um algoritmo adaptativo que adapta seus parâmetros durante o processo de codificação. Foram propostos quatro critérios de ordenação de coeficientes, e observamos que a busca em largura obteve o melhor desempenho. A ordenação proposta aumenta amplamente as sequências de zeros e introduz um decaimento suave no padrão dos coeficientes, melhorando a performance do Run-Length Golomb-Rice. O Moving Picture Experts Group e o Joint Photographic Experts Group iniciaram atividades visando a padronização de tecnologias relacionadas à compressão de nuvem de pontos. Com o objetivo de preservar compatibilidade, é preferível algoritmos baseado em aritmética de ponto fixo ao invés de aritmética de ponto flutuante. Portanto, também propomos uma modificação da Region-Adaptive Hierarchical Transform, traduzindo suas operações para ponto fixo. A modifi- cação na transformada mostrou pouca divergência em termos de taxa e performance com o algo- ritmo que utiliza ponto flutuante quando a precisão está em 8 bits ou mais. Ambos os algoritmos são virtualmente idênticos quando a precisão é de 10 bits ou mais. Por motivos práticos, a cada ponto da nuvem de pontos está associado uma única cor junto de outros atributos. O codificador Region-Adaptive Hierarchical Transform foi proposto para point clouds de uma única cor. Este método pode não ser muito realista pois, em objetos reais, a luz refletida pode variar significativamente com o ângulo de vista, especialmente se superfícies especulares estão presentes. Por isso, estamos interessados em uma representação mais completa, a plenoptic point cloud, onde todos os pontos estão associados com as cores em todas as direções. Aqui, propomos um método de compressão para esta representação. Em vez de codificar uma função contínua visto que há apenas um número finito de câmeras, faz sentido comprimir tanto números de cores quanto o número de câmeras e deixar a etapa de interpolação de cor para o decodificador, durante a renderização. Assim, cada voxel está associado a um vetor de valores de cor. Nós desenvolvemos e avaliamos aqui 4 métodos que estendem a Region-Adaptive Hierarchical Transform para englobar o caso multi-cor. Os experimentos com dados sintéticos nos ajudaram a correlacionar especularidade com a compressão, já que a especularidade de um objeto, em um dado ponto no espaço, afeta diretamente a diferença de cor entra as câmeras, impactando no desempenho do codificador. Simulações foram executadas usado dados naturais (capturados) e os resultados são apresenta- dos como curvas de taxa versus distorção que mostram que a combinação da transformada de Kahunen-Loève e a Region-Adaptive Hierarchical Transform atinge a melhor performance. Na compressão de imagem, pode ser possível que certas partes de uma imagem sejam de maior importância que o restante dela. Assim, também introduzimos a codificação por região de interesse para nuvens de pontos. A qualidade da região de interesse é priorizada em detrimento do restante da imagem. As vantagens de fazer isso são: • O usuário pode ser mais sensível aos artefatos introduzidos na região de interesse do que em qualquer outro lugar. Portanto, priorizar a qualidade da região de interesse pode levar a uma melhor qualidade subjetiva; • Podemos reduzir o número de bits necessários para codificar uma imagem, reduzindo o número de bits gastos para codificar regiões que são de pouco interesse, sem comprometer significativamente a qualidade subjetiva. Propusemos incluir a codificação de região de interesse em nuvens de pontos modificando a transformada. Nós desenvolvemos um algoritmo de detecção de face para nuvens de pontos como um exemplo de caso, uma vez que a atenção dos seres humanos tende a ir para a face, mas o algoritmo proposto é transparente à forma como a região de interesse foi definida. Não realizamos testes subjetivos para avaliar nossa proposta, mas analisamos o desempenho em termos de taxa- distorção. Observamos que podemos melhorar a qualidade da região de interesse com pouco impacto na relação entre sinal de pico e ruído de nuvem de pontos.
Abstract:	Point clouds have gained the attention of the community for real-time applications such as telep- resence and autonomous navigation. The Region-Adaptive Hierarchical Transform has been in- troduced as a low complexity attribute encoding algorithm for the compression of point clouds. It presents a performance competitive with state-of-the-art algorithms. In the original work, the Region-Adaptive Hierarchical Transform uses an Arithmetic Coder to entropy encode the quantized coefficients. We have observed that the performance of the entropy coder can be improved, without trading for complexity, by sorting the coefficients and using the Run-Length Golomb-Rice encoder, an adaptive algorithm that adapts its parameters during the encoding process. Four sorting criteria were proposed, and we observed that the breadth-first search obtained the best performance. The proposed ordering sequence largely increases the runs of zeros and introduces a smooth decay in the pattern of the coefficients, thus improving Run- Length Golomb-Rice performance. The Moving Picture Experts Group and the Joint Photographic Experts Group have initiated activities towards the standardization of point cloud compression technologies. For the sake of reproducibility, it is preferred to use algorithms based on fixed-point arithmetic instead of floating- point arithmetic. Therefore, we also propose a modification of the Region-Adaptive Hierarchical Transform, translating the operations to fixed-point arithmetic. The modification in the transform showed little divergence in terms of rate and performance with the floating-point arithmetic one when the precision was 8 bits or above. Both algorithms are virtually identical when the precision is 10 or above. For practical reasons, each point in the point cloud is usually associated with one single color along with other attributes. The Region-Adaptive Hierarchical Transform coder has been pro- posed for single-color point clouds. This approach may not be very realistic since, in real-world objects, the reflected light may significantly change with the viewing angle, especially if specular surfaces are present. For that, we are interested in a more complete representation, the plenoptic point cloud, wherein every point has associated colors in all directions. Here, we propose a com- pression method for such a representation. Instead of encoding a continuous function, since there is only a finite number of cameras, it makes sense to compress as many colors per voxel as cam- eras and to leave any intermediary color rendering interpolation to the decoder. Hence, each voxel is associated with a vector of color values for each color component. We have here developed and evaluated four methods to expand the Region-Adaptive Hierarchical Transform coder to encom- pass the multiple colors case. Experiments with synthetic data helped us to correlate specularity with the compression, since object specularity, at a given point in space, directly affects color dis- parity among the cameras, impacting the coder performance. Simulations were carried out using natural (captured) data, and results are presented as rate-distortion curves that show that a com- bination of Kahunen-Loève transform and the Region-Adaptive Hierarchical Transform achieves the best performance. In image compression, it may be possible that certain parts of an image are of higher impor- tance than the rest of the image. Thus, we have also introduced region-of-interest coding for point clouds. The quality of the region-of-interest is prioritized in detriment to the rest of the image. The advantages of doing so are: • The user may be more sensitive to artifacts introduced in the region-of-interest than any- where else. Therefore, prioritizing the quality of the region-of-interest may lead to better subjective quality; • We can reduce the number of bits necessary to encode an image by reducing the number of bits spent to encode regions that are of little interest without significantly compromising the subjective quality. We have proposed to include region-of-interest coding in point clouds by modifying the trans- form. We have developed a face detection algorithm for point clouds as an example case since humans’ attention tends to go toward the face, but the proposed algorithm is transparent to how the region-of-interest was defined. We have not performed subjective tests to evaluate our pro- posal, but have analyzed the performance in terms of rate-distortion. We observed that we can improve the quality of the region-of-interest with little impact in the overall point cloud peak signal to noise ratio.
Informações adicionais:	Tese (doutorado) — Universidade de Brasília, Faculdade de Tecnologia, Departamento de Engenharia Elétrica, 2019.
Licença:	A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor com as seguintes condições: Na qualidade de titular dos direitos de autor da publicação, autorizo a Universidade de Brasília e o IBICT a disponibilizar por meio dos sites www.bce.unb.br, www.ibict.br, http://hercules.vtls.com/cgi-bin/ndltd/chameleon?lng=pt&skin=ndltd sem ressarcimento dos direitos autorais, de acordo com a Lei nº 9610/98, o texto integral da obra disponibilizada, conforme permissões assinaladas, para fins de leitura, impressão e/ou download, a título de divulgação da produção científica brasileira, a partir desta data.
Agência financiadora:	CAPES
Aparece nas coleções:	Teses, dissertações e produtos pós-doutorado

Mostrar registro completo do item Visualizar estatísticas