跳转至

表达式树

前置知识

二叉树

目标

掌握表达式树代码模板

What

二叉树是表达式处理的常用工具。例如,表达式 a+b∗(c−d)−e/f

img

其中,每个非叶子结点表示一个运算符,

左子树是第一个运算数对应的表达式,

而右子树则是第二个运算数对应的表达式。

如何给一个表达式简历表达式树呢?

方法有很多,这里只介绍一种:找到“最后计算”的运算符(它是整颗表达式树的根),然后递归处理。

#include <bits/stdc++.h>

using namespace std;

const int N = 1010;

int lch[N], rch[N], idx, root;
char op[N], s[N];

int build_tree(char *s, int x, int y){
    int c1 = -1, c2 = -1, p = 0;
    int u;

    if (y - x == 1){   // 只有一个字符了 
        u = ++idx;
        lch[u] = rch[u] = -1;
        op[u] = s[x];
        return u;
    }

    for (int i = x; i < y; i++){
        if (s[i] == '(') p++;
        if (s[i] == ')') p--;
        if (s[i] == '+' || s[i] == '-')
            if (!p) c1 = i;
        if (s[i] == '*' || s[i] == '/')
            if (!p) c2 = i;
    }

    // 找不到括号外的加减,就用乘除
    if (c1 < 0) c1 = c2;
    // 整个表达式被一对括号括起来,往里缩一位 
    if (c1 < 0) return build_tree(s, x + 1, y - 1);

    u = ++idx;
    lch[u] = build_tree(s, x, c1);
    rch[u] = build_tree(s, c1 + 1, y);
    op[u] = s[c1];

    return u;
}

void in_order(int u){
    if (lch[u] == -1 && rch[u] == -1){
        cout << op[u];
        return ;
    }

    in_order(lch[u]);
    cout << op[u];
    in_order(rch[u]);
}

void pre_order(int u){
    if (lch[u] == -1 && rch[u] == -1){
        cout << op[u];
        return ;
    }

    cout << op[u];
    pre_order(lch[u]);
    pre_order(rch[u]);
}

int main(){
    scanf("%s", s);
    root = build_tree(s, 0, strlen(s));

    in_order(root);
    puts("");
    pre_order(root);

    return 0;
}

/*
a+b*(c-d)-e/f
*/

上述代码是如何寻找“最后一个运算符”的呢?

代码用了一个变量 p,只有当 p=0 时才考虑这个运算符。为什么呢?

因为括号里的运算符一定不是最后计算的,应当忽略。

例如,(a+b)*c 中虽然有一个加号,但却是在括号里的,实际上比它优先级高的乘号才是最后计算的。

由于加减和乘除号都是左结合的,最后一个运算符才是最后计算的,所以用两个变量 c1 和 c2 分别记录“最右”出现的加减号和乘除号。

再接下来的代码就不难理解了:

如果括号外有加减号,它们肯定最后计算;

但如果没有加减号,就需要考虑乘除号(if(c1 < 0) c1 = c2);

如果全都没有,说明整个表达式外面被一对括号括起来,把它去掉后递归调用。

这样,就找到了最后计算的运算符 s[c1],它的左子树是区间 [x, c1],右子树是区间 [c1+1, y]。

总结

掌握经典例题的代码

参考

紫书