WMA文件信息格式分析及代码

2024-03-08 10:32
文章标签 分析 代码 wma 信息格式

本文主要是介绍WMA文件信息格式分析及代码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

WMA文件信息格式分析及代码 收藏
ASF文件和WMA文件格式差不多。具体请看下面我写的代码。文件分析根据mplayer其中的asfhead.c提供的代码进行分析。mplayer只解除出了标准的wma头信息,其扩展信息并没有解析出来。代码如下.


/*
每一个WMA文件,它的头16个字节是固定的,为十六进制的“30 26 B2 75 8E 66 CF 11 A6 D9 00 AA 00 62 CE 6C”,用来标识这个是否为WMA文件。接下来的8个字节为一个整数,表示整个WMA文件头部的大小,这个头部里面包含了Tag信息等所有非音频信息,头部后面的是音频信息,我们在这里就不深入了解了。那个整数接下来的6个字节还没搞清楚是什么用的,不过不影响我们对Tag信息的读写。

       也就是说从文件开始偏移量为31开始,里面存放了很多帧,有我们需要的标准Tag信息,扩展Tag信息,WMA文件控制信息等等。每个帧不是等长的,但是帧头是固定的24个字节,其中前16字节是用来标识这个帧的名字,后8个字节是用来表示这个帧(包括帧头)的大小。这一点和MP3文件的ID3V2信息比较像。

        由于我们只需要读写Tag信息,而Tag信息又分别保存在两个帧里,分别为标准Tag帧和扩展Tag帧,所有我们只需要处理这两个帧,其他帧完全可以根据获得的帧长度来跳过。

       如图2,标准Tag帧只包含歌曲标题,艺术家,版权,备注四个内容。它的帧名是十六进制的“33 26 B2 75 8E 66 CF 11 A6 D9 00 AA 00 62 CE 6C”,在24个字节的帧头后紧跟着5个分别为2个字节的整数,前四个分别表示歌曲标题,艺术家,版权,备注的大小,第五个还不清楚是什么用的,大部分情况下是不使用的,即它的大小为0的。

        在这10个字节后,这四个信息的内容就按顺序存放了。记住,在WMA文件里,所有的文字都是按Unicode宽字符的编码方式储存的,而且每个字符串后面都又一个0结束字符的。

        再看扩展Tag帧,这里就比较麻烦了,里面包含的信息的个数是不确定的,每个信息也是按照像帧一样的方式组织起来的。扩展Tag帧的帧名是十六进制的“40 A4 D0 D2 07 E3 D2 11 97 F0 00 A0 C9 5E A8 50”,在24字节的帧头后先有一个两个字节的整数表示这个帧里一共有的扩展信息个数(ExNo)。

        每一个扩展信息包含扩展信息名字和对应的值。先有一个两个字节的整数来表示扩展名字信息的大小,接着是扩展信息,然后有一个两个字节的整数标志(Flag),这个后面再讲。然后又是一个两个字节的整数,表示值的大小。接着就是这个值。

       当扩展信息名字为WMFSDKVersion时,这个值表示的是这个WMA文件的版本;当扩展信息名字为WM/AlbumTitle时,这个值代表的就是专辑名;当扩展信息名字为WM/Genre时,这个值代表的就是流派;同理,很容易从扩展信息的名字看出这个值的用途的。这些扩展信息的名字和值几乎都是用Unicode的字符串来存储的,到现在为止只发现对下面两个情况例外

       下面再来看看那个标志Flag,这个基本上是为没什么用的(通常值为0),只对WM/TrackNumber和WM/Track这两个扩展信息名字有用,当Flag为3的时候后面的值(也就是曲目信息)是以4个字节的整数的形式表示,当Flag为0的时候,曲目信息是以普通的字符串形式表示的。
*/
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include<sys/mman.h>
typedef unsigned long long uint64_t;
typedef unsigned long uint32_t;
typedef unsigned short uint16_t;
typedef unsigned char uint8_t;
typedef long long int64_t;
typedef short int16_t;
typedef struct
{
    uint16_t title_size;
    uint16_t author_size;
    uint16_t copyright_size;
    uint16_t comment_size;
    uint16_t rating_size;
}ASF_content_description_t;
struct asf_tags
{
    char title[64];
    char author[64];
    char copyright[64];
    char comment[64];
    char rating[64];
    char **ext_info;
};

const uint8_t ff_log2_tab[256]={
        0,0,1,1,2,2,2,2,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,
        5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,
        6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,
        6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,
        7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
        7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
        7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
        7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7
};
static inline int av_log2(unsigned int v)
{
    int n;

    n = 0;
    if (v & 0xffff0000) {
        v >>= 16;
        n += 16;
    }
    if (v & 0xff00) {
        v >>= 8;
        n += 8;
    }
    n += ff_log2_tab[v];

    return n;
}
#define PUT_UTF8(val, tmp, PUT_BYTE)/
    {/
        int bytes, shift;/
        uint32_t in = val;/
        if (in < 0x80) {/
            tmp = in;/
            PUT_BYTE/
        } else {/
            bytes = (av_log2(in) + 4) / 5;/
            shift = (bytes - 1) * 6;/
            tmp = (256 - (256 >> bytes)) | (in >> shift);/
            PUT_BYTE/
            while (shift >= 6) {/
                shift -= 6;/
                tmp = 0x80 | ((in >> shift) & 0x3f);/
                PUT_BYTE/
            }/
        }/
    }

const char asf_file_format_guid[16] = {0x30, 0x26, 0xB2, 0x75, 0x8E,
  0x66, 0xCF, 0x11, 0xA6, 0xD9, 0x00, 0xAA, 0x00, 0x62, 0xCE, 0x6C};/*ASF文件标志*/

const char asf_content_desc_guid[16] = {0x33, 0x26, 0xb2, 0x75,
  0x8e, 0x66, 0xcf, 0x11, 0xa6, 0xd9, 0x00, 0xaa, 0x00, 0x62, 0xce, 0x6c};/*ASF 标志信息*/

const char asf_stream_ext_desc_guid[16] = {0x40, 0xA4, 0xD0, 0xD2, 0x07,
 0xE3, 0xD2, 0x11, 0x97, 0xF0, 0x00, 0xA0, 0xC9, 0x5E, 0xA8, 0x50};/*ASF扩展标志信息*/

 

#define AV_RL16(x)  ((((uint8_t*)(x))[1] << 8) | /
                      ((uint8_t*)(x))[0])
static char* get_ucs2str(const uint16_t* inbuf, uint16_t inlen)
{
    char* outbuf = calloc(inlen, 2);
    char* q;
    int i;
    if (!outbuf)
    {
        return NULL;
    }
    q = outbuf;
    for (i = 0; i < inlen / 2; i++)
    {
        uint8_t tmp;
        PUT_UTF8(AV_RL16(&inbuf[i]), tmp, *q++ = tmp;)
    }
    return outbuf;
}
int find_asf_guid(char *buf, const char *guid, int cur_pos, int buf_len)
{
  int i;
  for (i = cur_pos; i < buf_len - 19; i++) {
    if (memcmp(&buf[i], guid, 16) == 0)
      return i + 16 + 8; // point after guid + length
  }
  return -1;
}
int asf_ext_info_add(struct asf_tags* tags, const char *opt, const char *param)
{
    char **info = tags->ext_info;
    int n = 0;
    for(n = 0; info && info[2*n] != NULL; n++)
    {
        if(!strcasecmp(opt,info[2*n]))
        {
               free(info[2*n+1]);
            info[2*n+1] = strdup(param);
            return 0;
        }
    }
    info = tags->ext_info = (char**)realloc(info,(2*(n+2))*sizeof(char*));
    info[2*n] = strdup(opt);
    info[2*n+1] = strdup(param);
    memset(&info[2*(n+1)],0,2*sizeof(char*));
    return 1;
}
enum metadata_s
{
    /* common info */
    META_INFO_TITLE=0,
    META_INFO_AUTHOR,
    META_INFO_COPYRIGHT,
    META_INFO_COMMENT,
    META_INFO_WMFSDKVERSION,
    META_INFO_WMFSDKNEEDED,
    META_INFO_ISVBR,
    META_INFO_WMPROMOTIONURL,
    META_INFO_WMGENREID,
    META_INFO_WMTRACK,
    META_INFO_WMTRACENUMBER,
    META_INFO_WMYEAR,
    META_INFO_WMENCODINGTIME,
    META_INFO_WMGENRE,
    META_INFO_WMALBUMTITLE,
    META_INFO_PEAKVALE,
    META_INFO_AVERAGELEVEL
};
typedef enum metadata_s metadata_t;
static char *get_asf_info (struct asf_tags* tags,char *tag)
{
    char **info = tags->ext_info;
    int n;
    if (!info || !tag)
        return NULL;
    for (n = 0; info[2*n] != NULL ; n++)
    {
        if (!strcmp (info[2*n], tag))
            break;
    }
    return info[2*n+1] ? strdup (info[2*n+1]) : NULL;
}
char *get_metadata (struct asf_tags* tags,metadata_t type)
{
    switch (type)
    {
        case META_INFO_TITLE:
        {
            return tags->title;
        }
        case META_INFO_AUTHOR:
          {
            return tags->author;
        }
        case META_INFO_COPYRIGHT:
        {
            return tags->copyright;
        }
        case META_INFO_COMMENT:
        {
            return tags->comment;
        }
        case META_INFO_WMFSDKVERSION:
        {
            return get_asf_info(tags,"WMFSDKVersion");
        }
        case META_INFO_WMFSDKNEEDED:
        {
            return get_asf_info(tags,"WMFSDKNeeded");
        }
        case META_INFO_ISVBR:
        {
            return get_asf_info(tags,"IsVBR");
        }
        case META_INFO_WMPROMOTIONURL:
        {
            return get_asf_info(tags,"WM/PromotionURL");
        }
        case META_INFO_WMGENREID:
        {
            return get_asf_info(tags,"WM/GenreID");
        }
        case META_INFO_WMTRACK:
        {
                return get_asf_info(tags,"WM/Track");
        }
        case META_INFO_WMTRACENUMBER:
        {
                return get_asf_info(tags,"WM/TrackNumber");
        }
        case META_INFO_WMYEAR:
        {
            return get_asf_info(tags,"WM/Year");
        }
        case META_INFO_WMENCODINGTIME:
        {
            return get_asf_info(tags,"WM/EncodingTime");
        }
        case META_INFO_WMGENRE:
        {
            return get_asf_info(tags,"WM/Genre");
        }
        case META_INFO_WMALBUMTITLE:
        {
            return get_asf_info(tags,"WM/AlbumTitle");
        }
        case META_INFO_PEAKVALE:
        {
            return get_asf_info(tags,"PeakValue");
        }
        case META_INFO_AVERAGELEVEL:
        {
            return get_asf_info(tags,"AverageLevel");
        }
    }
}
int read_asf_header(char  *filename,struct asf_tags* tags)
{
    int hdr_len;
    char *hdr = NULL;
    int pos;
    int fd;
    char buffer[16];
    struct stat sb;
    fd=open(filename,O_RDONLY);
    if(fd==-1)
    {
        printf("open file error/n");
        return 0;
    }
    memset(buffer,0,16);
    fstat(fd,&sb); /*取得文件大小*/
    hdr=mmap(NULL,sb.st_size,PROT_READ,MAP_PRIVATE,fd,0);
    if(hdr== MAP_FAILED) /*判断是否映射成功*/
    {
        return 0;
        close(fd);
    }
    strncpy(buffer,hdr,16);
    if(strcmp(buffer,asf_file_format_guid))/*根据ASF标志信息判断是否为ASF文件*/
    {
        printf("file not an asf file/n");
        close(fd);
        munmap(hdr,sb.st_size);
        return 0;
    }
    hdr_len=sb.st_size;
    pos = find_asf_guid(hdr, asf_content_desc_guid, 0, hdr_len);/*找到标志信息位置*/
    if (pos >= 0)
    {
        ASF_content_description_t *contenth = (ASF_content_description_t *)&hdr[pos];
        unsigned char *string=NULL;
        uint16_t* wstring = NULL;
        uint16_t len;
        pos += sizeof(ASF_content_description_t);
        if (pos > hdr_len) goto len_err_out;
        //le2me_ASF_content_description_t(contenth);
        // extract the title
        if((len = contenth->title_size) != 0)
        {
            wstring = (uint16_t*)&hdr[pos];
            pos += len;
            if (pos > hdr_len) goto len_err_out;
            if ((string = get_ucs2str(wstring, len)))/*J解析成UTF8*/
            {
                    strcpy(tags->title, string);
                free(string);
            }
        }
        // extract the author
        if((len = contenth->author_size) != 0)
        {
            wstring = (uint16_t*)&hdr[pos];
            pos += len;
            if (pos > hdr_len) goto len_err_out;
            if ((string = get_ucs2str(wstring, len)))
            {
                strcpy(tags->author, string);
                free(string);
            }
        }
        if((len = contenth->copyright_size) != 0)
        {
            wstring = (uint16_t*)&hdr[pos];
            pos += len;
            if (pos > hdr_len) goto len_err_out;
            if ((string = get_ucs2str(wstring, len)))
            {
                strcpy(tags->copyright, string);
                free(string);
            }
        }
        // extract the comment
        if((len = contenth->comment_size) != 0)
        {
            wstring = (uint16_t*)&hdr[pos];
            pos += len;
            if (pos > hdr_len) goto len_err_out;
            if ((string = get_ucs2str(wstring, len)))
            {
                strcpy(tags->comment, string);
                free(string);
            }
        }
        // extract the rating
        if((len = contenth->rating_size) != 0)
        {
            wstring = (uint16_t*)&hdr[pos];
            pos += len;
            if (pos > hdr_len) goto len_err_out;
            if ((string = get_ucs2str(wstring, len)))
            {
                strcpy(tags->rating, string);
                free(string);
            }
        }
    }
    pos = find_asf_guid(hdr, asf_stream_ext_desc_guid, 0, hdr_len);/*找到扩展信息标志位置*/
    if (pos >= 0)
    {
        int i;
        //unsigned char *ext_desc;
        uint16_t flag;
        uint16_t ext_desc_num;
        unsigned char *string_name=NULL;
        unsigned char *string_info=NULL;
        uint16_t* wstring = NULL;
        uint16_t len;
        ext_desc_num=(*(uint16_t*)(&hdr[pos]));
        //printf("%d/n",ext_desc_num);
        pos += 2;   
        for(i=0;i<ext_desc_num;i++)
        {
            len=(*(uint16_t*)(&hdr[pos]));/*扩展名字信息大小*/
            pos+=2;
            wstring=(uint16_t*)&hdr[pos];
            if ((string_name = get_ucs2str(wstring, len)))
            {
                        //printf(" %d.扩展信息名字 %s/n", i,string_name);
                //free(string_name);
            }
            pos+=len;
            flag=(*(uint16_t*)(&hdr[pos]));/*标志*/
            pos+=2;
            len=(*(uint16_t*)(&hdr[pos]));/*扩展名字对应值大小*/
            pos+=2;
            wstring=(uint16_t*)&hdr[pos];
            if ((string_info = get_ucs2str(wstring, len)))
            {
                        //printf(" 扩展信息对应的值 %s/n",string_info);
                //free(string_info);
            }
            asf_ext_info_add(tags,string_name,string_info);
            pos+=len;
        }
    }
    close(fd);
    munmap(hdr,sb.st_size);
    return 1;
    len_err_out:
    close(fd);
    munmap(hdr,sb.st_size);
    return 0;
}
int main(int argc,char **argv)
{
    char *filename=argv[1];
    int i;
    char **info;
    struct asf_tags tags;
    tags.ext_info=(char**)malloc(2*sizeof(char*));
    read_asf_header(filename,&tags);
    char **ext_info;
    printf("Title:%s/n",tags.title);
    printf("Author:%s/n",tags.author);
    printf("Copyright:%s/n",tags.copyright);
    printf("Comment:%s/n",tags.comment);
    printf("Rating:%s/n",tags.rating);
    info = tags.ext_info;
    for(i = 0; info[2*i] != NULL ; i++)
    {
        printf("%s: %s/n",info[2*i],info[2*i+1]);
    }
    return 0;
}
这里已经做了相关信息的接口,利于扩展开发。希望这些能对那些正在进行相关开发的人员提供一点帮助。本人从事音频视频解码,希望能和大家一起探讨,共通进步。联系方法QQ:263542344

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/benny5609/archive/2008/05/07/2409533.aspx

 

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/yueyihua/archive/2010/04/20/5508286.aspx

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/yueyihua/archive/2010/04/20/5508286.aspx

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/yueyihua/archive/2010/04/20/5508286.aspx

这篇关于WMA文件信息格式分析及代码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/786813

相关文章

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

Visual Studio 2022 编译C++20代码的图文步骤

《VisualStudio2022编译C++20代码的图文步骤》在VisualStudio中启用C++20import功能,需设置语言标准为ISOC++20,开启扫描源查找模块依赖及实验性标... 默认创建Visual Studio桌面控制台项目代码包含C++20的import方法。右键项目的属性:

MySQL中的表连接原理分析

《MySQL中的表连接原理分析》:本文主要介绍MySQL中的表连接原理分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、环境3、表连接原理【1】驱动表和被驱动表【2】内连接【3】外连接【4编程】嵌套循环连接【5】join buffer4、总结1、背景

MySQL数据库的内嵌函数和联合查询实例代码

《MySQL数据库的内嵌函数和联合查询实例代码》联合查询是一种将多个查询结果组合在一起的方法,通常使用UNION、UNIONALL、INTERSECT和EXCEPT关键字,下面:本文主要介绍MyS... 目录一.数据库的内嵌函数1.1聚合函数COUNT([DISTINCT] expr)SUM([DISTIN

python中Hash使用场景分析

《python中Hash使用场景分析》Python的hash()函数用于获取对象哈希值,常用于字典和集合,不可变类型可哈希,可变类型不可,常见算法包括除法、乘法、平方取中和随机数哈希,各有优缺点,需根... 目录python中的 Hash除法哈希算法乘法哈希算法平方取中法随机数哈希算法小结在Python中,

Java实现自定义table宽高的示例代码

《Java实现自定义table宽高的示例代码》在桌面应用、管理系统乃至报表工具中,表格(JTable)作为最常用的数据展示组件,不仅承载对数据的增删改查,还需要配合布局与视觉需求,而JavaSwing... 目录一、项目背景详细介绍二、项目需求详细介绍三、相关技术详细介绍四、实现思路详细介绍五、完整实现代码

Java Stream的distinct去重原理分析

《JavaStream的distinct去重原理分析》Javastream中的distinct方法用于去除流中的重复元素,它返回一个包含过滤后唯一元素的新流,该方法会根据元素的hashcode和eq... 目录一、distinct 的基础用法与核心特性二、distinct 的底层实现原理1. 顺序流中的去重

Go语言代码格式化的技巧分享

《Go语言代码格式化的技巧分享》在Go语言的开发过程中,代码格式化是一个看似细微却至关重要的环节,良好的代码格式化不仅能提升代码的可读性,还能促进团队协作,减少因代码风格差异引发的问题,Go在代码格式... 目录一、Go 语言代码格式化的重要性二、Go 语言代码格式化工具:gofmt 与 go fmt(一)

HTML5实现的移动端购物车自动结算功能示例代码

《HTML5实现的移动端购物车自动结算功能示例代码》本文介绍HTML5实现移动端购物车自动结算,通过WebStorage、事件监听、DOM操作等技术,确保实时更新与数据同步,优化性能及无障碍性,提升用... 目录1. 移动端购物车自动结算概述2. 数据存储与状态保存机制2.1 浏览器端的数据存储方式2.1.