数据结构与算法(C语言版)—哈夫曼编译码器
1、需求分析
1.1、问题阐述
利用哈夫曼编码进行通信可以大大提高信道利用率,缩短信息传输时间,降低传输成本。但是,这要求在发送端通过一个编码系统对待传数据预先编码,在接收端将传来的数据进行译码(复原)。对于双工信道(即可以双向传输信息的信道) ,每端都需要一个完整的编/译码系统。试为这样的信息收发站写一个哈夫曼码的编/译码系统。
1.2、基本要求
一个完整的系统应具有以下功能;
(1) I:初始化(Initialization)。从终端读入字符集大小n,以及n个字符和n个权值,建立哈夫曼树,并将它存于文件hfmTree中。
(2) E:编码(Encoding).利用以建好的哈夫曼树(如不在内存,则从文件hfm’Tree中读入) ,对文件ToBeTran中的正文进行编码,然后将结果存入文件CodeFile中。
(3)D:译码(Decoding)。利用已建好的哈夫曼树将文件CodeFile中的代码进行译码,结果存入文件TextFile中。
(4) P:印代码文件(Print)。将文件CodeFile以紧凑格式显示在终端上.每行50个代码。同时将此字符形式的编码文件写入文件CodePrin中。
(5) T:印哈夫曼树(Tree printing) 。将已在内存中的哈夫曼树以直观的方式(树或凹入表形式)显示在终端上,同时将此字符形式的哈夫曼树写入文件TreePrint中。
1.3、测试数据
(1)利用教科书例6-2的数据测试程序:

(2)用下表给出的字符集和权重建立哈夫曼树,并实现以下报文的编码和译码:“THIS PROGRAM IS MY FAVORITE”。
|
字符 |
空格 |
A |
B |
C |
D |
E |
F |
G |
H |
|
频度 |
186 |
64 |
13 |
22 |
32 |
103 |
21 |
15 |
47 |
|
字符 |
I |
J |
K |
L |
M |
N |
O |
P |
Q |
|
频度 |
57 |
1 |
5 |
32 |
20 |
57 |
63 |
15 |
1 |
|
字符 |
R |
S |
T |
U |
V |
W |
X |
Y |
Z |
|
频度 |
48 |
51 |
80 |
23 |
8 |
18 |
1 |
16 |
1 |
2、设计概要
利用数组开到2*n-1的内存来存储哈夫曼树,然后利用文件流的操作读取、保存文件来实现各个功能。
3、详细设计
- 对于I初始化操作,从终端读取字符集大小n和n个字符,n个权值,然后开数组2*n-1,遍历n到2*n-1 ,每次查询数组0-N中没有双亲的结点的最小和次小结点作为该结点的左、右子节点。以此建立哈夫曼树,然后将哈夫曼树的各个数据存储进hfmTree.txt文件中。
- 对于E编码操作,利用建立好的哈夫曼树,首先进行各个字符的二进制码的编写,代码中利用了递归的算法,每次都对结点进行二进制编码赋值,然后递归左子树加个“0”,右子树则加个“1”,这样便生成了每个结点的二进制编码串了,然后读入文件ToBETran.txt文件中的数据,遍历数据中每一个字符,对每个字符代表的二进制编码存进Code File.txt文件中,便成功完成了编码。
- 对于D 译码操作,读取Code File.txt文件中的数据,定义一个pi=2*n-2(代表根节点),然后遍历数据,如果该数据为‘0’,则pi = hfmtree[pi].lchild,等于它的左子树的结点,否则pi 就等于它的右子树的结点,如果此时pi刚好为叶子节点,那么可以直接输出pi结点代表的字符,同时将pi再次赋值为2*n-2。最后便完成了所有数据的译码,并且存储进TextFile.txt文件。
- 对于P印代码文件操作,首先读取出CodeFile文件中的数据,然后以每行50个输出,代码设置了一个pi=1,在循环中pi与一直加1,如果pi%50==0就输出u按行符,并且将换行好的数据存放进CodePrin.txt文件中。
- 对于T打印哈夫曼树操作,我们利用了二位字符数组存放字符,首先全部赋值为空格,其次利用前序遍历哈夫曼树,将结点用‘o’存进二维数组中,最终我们可以以直观的形似看到这棵树,然后再输出它的前序遍历结果即可。
4、用户手册
输入I、E、D、P、T、Q进行不同的操作。

5、测试数据
①对测试数据(1)的测试结果:
1.当输入I时会初始化输入字符集和频率并建立哈夫曼树,同时将哈夫曼树的数据保存进hfmTree.txt文件中。(代码会自动将频度换成权重)

2.输入E时,会创建二进制哈夫曼编码,并且从ToBetran文件中读取的正文进行编码,然后将编码存放于CodeFile文件。(测试的ToBetran文件为:“ABBCAAEFGH”)。结果完全正确!

3.当输入D时,会对CodeFile文件中的二进制编码进行译码,译码后,将结果存进TextFile文件中。如图,译码的结果和我们文件中的样例完全一致,说明结果正确!

4.当输入P时,进行打印编码操作,将CodeFile文件中的数据以50一行在终端进行显示,然后存储进CodePrin文件,结果以50一行输出在终端,并且已经存进了CodeFile文件中,结果正确!

5.当输入T时,系统会打印哈夫曼树:这里以‘o’作为结点,更加的美观,便于观看,同时输出它的前序遍历结果。如图:结果正确。

6.当输入Q时,直接退出:

②对测试数据(2)的测试结果:
1.当输入I时会初始化并建立哈夫曼树,同时将哈夫曼树的数据保存进hfmTree.txt文件中。


2.输入E时,会创建二进制哈夫曼编码,并且从ToBetran文件中读取的正文进行编码,然后将编码存放于CodeFile文件。(测试样例提供的ToBetran文件为:“THIS PROGRAM IS MY FAVORITE”)。结果完全正确!

3.当输入D时,会对CodeFile文件中的二进制编码进行译码,译码后,将结果存进TextFile文件中。如图,译码的结果和我们文件中的样例完全一致,说明结果正确。

4.当输入P时,进行打印编码操作,将CodeFile文件中的数据以50一行在终端进行显示,然后存储进CodePrin文件,结果以50一行输出在终端,并且已经存进了CodeFile文件中,结果正确!

5.当输入T时,系统会打印哈夫曼树:这里以‘o’作为结点,更加的美观,便于观看,同时输出它的前序遍历结果。由于数据过多,打印出来在终端自动换行了,所以利用小的数据进行对打印操作的测试,利用(A B C D E)权重为:(3 2 4 5 7);如图:结果正确。

6.当输入Q时,直接退出:

- 附录
源程序文件名清单:
CodeFile.txt
CodePrin.txt
hfmTree.txt
TextFile.txt
ToBetran.txt
哈夫曼编译码器.cpp
哈夫曼编译码器.exe
5、源代码
//
// Created by stu_kk on 2022/4/16.
//
#include
using namespace std;
int n = 0;
char word[10001];//
int wei[10001];//权重
typedef struct HuffmanTree{
char pi;
int weight;
int parent,lchild,rchild;
}Tree;
string code[10000];
//初始化操作
Tree *hftree;
void crearteTree(int n){
hftree= (Tree*) malloc(sizeof(Tree)*(2*n-1));
for(int i = 0;i<n;i++){
hftree[i].pi = word[i];
hftree[i].weight = wei[i];
hftree[i].parent = hftree[i].lchild = hftree[i].rchild = -1;
}
for(int i = n;i<2*n-1;i++){
hftree[i].parent = -1;
hftree[i].pi = '$';
int min = 1000000;//最小
int cmin = 1000000;//次小
int mpi = -1;
int cmpi = -1;
for(int j = 0;j<i;j++){
if(hftree[j].parent == -1) {
if (hftree[j].weight < min) {
if(min < cmin){
cmin = min;
cmpi = mpi;
}
min = hftree[j].weight;
mpi = j;
}
else {
if (hftree[j].weight < cmin) {
cmin = hftree[j].weight;
cmpi = j;
}
}
}
}
hftree[i].weight = cmin+min;
hftree[i].lchild = mpi;
hftree[i].rchild = cmpi;
hftree[mpi].parent = i;
hftree[cmpi].parent = i;
}
}
void Init(){
cout<<"输入的是(1.权重)还是(2.字符出现频率)"<>is1;
if(is1 == 1){
cout<>n;
cout<<"输入"<<n<<"个字符集:(如果输入的是空格,请用'.'表示)";
for(int i = 0;i>word[i];
}
cout<<"输入"<<n<<"个字符集的权重:";
for(int i = 0;i>wei[i];
}
}
else{
cout<>n;
cout<<"输入"<<n<<"个字符集:(如果输入的是空格,请用'.'表示)";
for(int i = 0;i>word[i];
}
cout<<"输入"<<n<<"个字符集的出现频率:";
for(int i = 0;i>as;
wei[i] = as * 100;
}
};
cout<<"输入数据成功,正在创建哈夫曼树......."<<endl;
crearteTree(n);
cout<<"创建哈夫曼树成功,下面输出该哈夫曼树的参数。"<<endl;
cout<<"结点i"<<"\t字符"<<"\t权值"<<"\t双亲"<<"\t左孩子"<<"\t右孩子"<<endl;
for(int i = 0;i<2*n-1;i++){
cout<<i<<"\t"<<hftree[i].pi<<"\t"<<hftree[i].weight<<"\t"<<hftree[i].parent<<"\t"<<hftree[i].lchild<<"\t"<<hftree[i].rchild<<endl;
}
FILE *fp;
if((fp = fopen("hfmTree.txt","w")) == NULL){
cout<<"打开文件失败"<<endl;
}
//数据存进hfmTree.txt文件
for(int i = 0;i<2*n-1;i++){
fprintf(fp,"%d ",i);
fwrite(&word[i],1,1,fp);
fprintf(fp," %d ",hftree[i].weight);
fprintf(fp,"%d ",hftree[i].parent);
fprintf(fp,"%d ",hftree[i].lchild);
fprintf(fp,"%d ",hftree[i].rchild);
}
fclose(fp);
cout<<"哈夫曼树创建成功并且存入文件hfmTree.txt中了!!!"<<endl;
}
//初始化操作
//EEEEEEEEEEEEEEE编码编码
void bianma(Tree *tree,int pi,string s){//递归编码
code[tree[pi].pi] = s;
if(tree[pi].lchild != -1)
bianma(tree,tree[pi].lchild,s+"0");
if(tree[pi].rchild != -1)
bianma(tree,tree[pi].rchild,s+"1");
}
void E(){//编码
bianma(hftree,2*n-2,"");
cout<<"二进制码生成成功,编码结果为:"<<endl;
cout<<"结点i"<<"\t字符"<<"\t权值"<<"\t编码"<<endl;
for(int i = 0;i<n;i++){
cout<<i<<"\t"<<hftree[i].pi<<"\t"<<hftree[i].weight<<"\t"choose;
switch (choose) {
case 'I':
Init();
break;
case 'E'://c创建二进制哈夫曼编码,并且从ToBetran文件中读取的正文进行编码,然后存放于CodeFile文件
E();
break;
case 'D'://对CodeFile文件中的二进制编码进行译码。
D();
break;
case 'P':
P();//将CodeFile文件中的数据以50一行在终端进行显示,然后存储进CodePrin文件
break;
case 'T':
T();//打印哈夫曼树
break;
case 'Q':
exit(0);
default:
break;
}
}
return 0;
}
其中,一些文件为:
ToBetran.txt文本中的数据为:
THIS PROGRAM IS MY FAVORITE
三个月前写的了,如果有问题的话,就直接联系我要一些文件。
本文来自网络,不代表协通编程立场,如若转载,请注明出处:https://net2asp.com/003783f56a.html
